版权声明
这些笔记基于《Python for Data Analysis, 3rd Edition》一书的内容总结和理解。原书由 Wes McKinney 编写,出版商为 O’Reilly,ISBN 978-1-098-10403-0。版权声明如下:
MIT License
Original work Copyright (c) 2024 Wes McKinney
Permission is hereby granted, free of charge, to any person obtaining a copy
of this software and associated documentation files (the "Software"), to deal
in the Software without restriction, including without limitation the rights
to use, copy, modify, merge, publish, distribute, sublicense, and/or sell
copies of the Software, and to permit persons to whom the Software is
furnished to do so, subject to the following conditions:
The above copyright notice and this permission notice shall be included in
all copies or substantial portions of the Software.
Python 基础学习结束了,在经过一天的时间反复看评论之后,我决定采纳 do 佬 xking 一位 Java 从业者的建议,学习 Python 第三方库 pandas。
通过不断的搜索,发现能使用 pandas 的职业往往是大数据或数据处理分析等行业,可能需要特别特别高的学历,这对我来说很陌生,很有挑战性。现在也没有工作,没有收入来源,可我也不在乎自己的学历了,工作的事,明年我会再继续找,反正攒钱也只是为了安乐离世逃避痛苦,再想想办法吧由于经历过看自己找的 bilibili 视频缺少知识概念的情况,为了避免学得不全面,就打算选择看书这种乏味的方式进行系统学习。于是我又去网上搜索,发现网络上都在推荐 《Python for Data Analysis, 3E》 这本书,而且可以在线阅读,官方还贴心地提供了项目源代码 GitHub - wesm/pydata-book。
书籍中提到不得复制或分发开源书籍的内容。这些代码示例已获得 MIT 许可,我去网上搜索大概阅读了一下,也不是特别懂,大概就是说我的笔记必须用自己的语言总结避免过多复制,并且标注出处和链接,多写个人的理解和总结。由于书籍是纯外语的,我打算用浏览器自带的翻译功能进行阅读,这使得本来就有挑战性的学习更加具有挑战性。
看书学习不像看视频学习,比较枯燥,需要更多时间去消化理解,这对我来说是否能坚持下去是个未知数。不过书籍提供了源代码和详细内容,应该能减轻学习难度,希望如此。
如果你是外语大佬又是计算机大佬,推荐自行阅读学习,肯定会比我快。学习一开始,先阅读前言和序章,看看作者的思想是怎样的。
这个是我搜索总结的关于 MIT 协议简介
MIT 许可协议是一种非常宽松的开源软件许可证。它允许你自由地使用、复制、修改、合并、发布、分发、再许可和出售软件的副本,但需要满足以下条件:
- 必须在软件的所有副本或主要部分中包含原始许可证的声明和版权声明。
- 软件按“现状”提供,没有任何形式的担保。
阅读内容简介
关于 3 代开放版的介绍
链接在此:Python for Data Analysis, 3E
针对 pandas 2.0.0 和 Python 3.10 进行了更新。第三版的变化主要是使内容与 2017 年以来 pandas 的发展保持同步,包括新增和废除的功能。这一点可以从更新历史中得到验证。
前言
链接在此:Python for Data Analysis, 3E - Preface
第一版于 2012 年发布,那个时候的 Python 开源数据分析库(尤其是 pandas)非常新颖且发展迅速。2016 年和 2017 年作者在编写第二版时,不仅需要更新到 Python 3.6(一版使用的是 Python 2.7),还需要更新过去五年中 pandas 发生的许多变化。
到了 2022 年,Python 语言的变化趋于稳定(处于 Python 3.10,3.11 将于 2022 年底发布),但 pandas 仍在继续发展。第三版中,作者的目标是使内容与当前版本的 Python、NumPy、pandas 和其他项目保持同步,同时在较新 Python 项目时保持相对保守。由于这本书已成为许多大学课程和工作专业人士的重要资源,作者希望尽力避免主题在短时间内过时,从而使其在 2023 年、2024 年及以后仍然有用。
第三版的一个重要新特性是开放获取在线版本,托管在网站 Python for Data Analysis, 3E 上,作者计划定期更新,这对学习者来说是个极大的福利,非常开源自由,我喜欢自由,感谢作者
使用约定
链接在此:Python for Data Analysis, 3E - Preface
书籍中的文字使用斜体、等宽、等宽粗体和等宽斜体格式。
斜体:用于表示新术语、URL、电子邮件地址、文件名和文件扩展名。
等宽:用于程序列表,以及在段落中引用程序元素,例如变量或函数名称、数据库、数据类型、环境变量、语句和关键字。
等宽粗体:用于需要让用户学习练习逐字键入的命令或其他文本。
等宽斜体:用于替换需要让用户了解的提供值或上下文确定的值的文本。
Tip: 提示或建议。
Note: 一般注释。
Caution: 警告或注意事项。
配套代码
链接在此:Python for Data Analysis, 3E - Preface
在线学习培训机构宣传
链接在此:Python for Data Analysis, 3E - Preface
作者推荐的培训机构,可能是为了推广培训服务。
联系方式
链接在此:Python for Data Analysis, 3E - Preface
提供了联系作者和出版社的方法。
致谢
链接在此:Python for Data Analysis, 3E - Preface
作者感谢了世界各地的人,特别提到帮助他制作第一版书籍的朋友和同事,其中 John D. Hunter 在与病魔斗争中离世,作者悼念了他的贡献,并表示这部作品也是对他的纪念。作者还感谢家人在他创作过程中给予的支持和理解,仅仅几段文字能让人感受到作者的顽强和感恩。
学习参考
Python for Data Analysis, 3E
GitHub - wesm/pydata-book: Materials and IPython notebooks for “Python for Data Analysis” by Wes McKinney, published by O’Reilly Media
麻省理工学院许可证 - 开源计划 — The MIT License – Open Source Initiative
麻省理工学院许可证 - 维基百科,免费的百科全书 — MIT License - Wikipedia
GitHub - aws/mit-0: The “MIT No Attribution” (MIT-0) License