阅读本系列的提示
致谢
首先,感谢大神开源的原书AAAMLP:https://github.com/abhishekkrthakur/approachingalmost/tree/master
其次,感谢AAAMLP-CN的组织者ytzfhqs,部分中文译文是摘自该仓库的:
AAAMLP-CN :https://github.com/ytzfhqs/AAAMLP-CN
该栏目创建的目的
AAAMLP原书全称Approaching Almost All Machine Learning Problems,是一部机器学习领域中非常经典的好书,包含作者本人在机器学习领域的深刻认识(作者大神是Kaggle金牌收割者,已在北欧某AI公司任首席数据科学家),有丰富的代码和实践结果,堪称ML新手不可不读的经典。
本栏目创建的初衷是校对代码,由于本书年份较久,原文代码依赖包关系在近年已经更新换代,其代码编写方式、传递参数也有所不同,所以在此校对出可用版本。
原文翻译也部分摘自AAAMLP-CN,本栏目的内容存在我自己的一些批注,这些批注大部分存在于代码段中。
目前校对过的代码在我的本机运行环境下是正确的,但运行环境不同,可能会有部分代码运行结果不同或运行错误。
我的运行环境
经2025年2月测试后,可用的环境:
Windows 10
16GB RAM
AMD Ryzen 7 5800 with Radeon Graphics
Nvidia RTX 3060
Python: Version: 3.10.12
Numpy: Version: 1.26.4
Pandas: Version: 1.5.3
scipy: Version: 1.13.1
seaborn: Version: 0.12.2
matplotlib: Version: 3.8.4
scikit_learn : Version: 1.5.0 # 这个包比较重要,sklearn已经被弃用了,不再维护,原书涉及sklearn较多,建议换成这个