SonicHuang's Blog

The way of programming in Python

Deeplearning 笔记：Numpy dot,cumsum,花式索引,布尔屏蔽等

Posted on 2019-05-24 | In python

1. `os.abspath(file)`表示当前所在py文件的绝对路径，注意这个函数不能单独在命令行运行必须要在py文件里面。`os.path.dirname()`表示其所在的文件夹

近期关于学习Python的思考

Posted on 2019-05-15 | In python

从写完几篇爬虫后至今有二十几天没有更新文章了。

这期间我做了三件事：

爬虫-精品聚合网下载图片

Posted on 2019-04-23 | In python

之前写了两篇下载煎蛋网图片的文章，这篇是精品聚合网妹子图片下载，与从煎蛋网下载极为类似，就不再细说，下载完成后有也有一万多张照片。

爬虫-下载上万张煎蛋网旧图片

Posted on 2019-04-23 | In python

继上一篇从煎蛋网下载妹子图片后，在网上发现另外两个途径可以下载到煎蛋网往年的旧图片。第一个是个网页，作者把所有图片地址写入一个网页中，没有一个文字只有图片有五千多张。第二个是一个本地html文件，也是一样用浏览器打开后全是图片，有六千多张。据我后面看着两个地方的图片还没有发现重复的。全部下载完，除去一些失效的图片链接，有上万张。

爬虫-煎蛋网图片下载和分类

Posted on 2019-04-10 | In python

一. 通过爬取煎蛋网随手拍，下载网页上的图片。

爬虫-百度词条副标题以及生成器的用法

Posted on 2019-03-23 | In python

我们通过输入关键字，爬取百度百科该关键字网页上的解释和其他词条的链接以及对应的副标题，最后控制显示链接的数量。

百度百科“网络爬虫”的词条

Posted on 2019-03-20 | In python

第一次接触正则表达式，和BeautifulSoup，第一印象就是复杂，必须要专门抽时间深入学习才行。

今天这个脚本初步应用他们的基本功能，爬取百度百科一个词条里面的其他词条链接。脚本没有采用之前的urllib.request而是直接用了request库来读取网页数据，据说这个更强大。

爬虫-proxy

Posted on 2019-03-09 | In python

昨天看了小甲鱼的爬虫这章用代理和添加user agent来爬取网页的视频，对其中的内容不是十分了解，所以专门写了这篇文章来理解其中的方法。

华为手机通讯录

Posted on 2019-03-07 | In python

在恢复出厂设置时，把老爸的华为麦芒通讯录搞丢了，但老人家保留了一个比较早的一个通讯录电子表格，自己录入的格式没有固定。我就想有没有比较方便的方法，用代码写一个通讯录，再导入到手机里面。

Git-Markdown-Typora操作问题解决方案记录

Posted on 2019-02-26 | In git

学习Markdown, Git, Typora第一天开始就出现很多操作上的问题，当时解决了后来又忘记。我想有必要把每次出现的问题记录一下。这篇文章将会持续更新。

从学习Markdown, Git, Typora第一天开始就出现很多操作上的问题，当时解决了后来又忘记。我想有必要把每次出现的问题记录一下。持续更新中。。。。

SonicHuang

Sharing everything I'm learning to program in Python.