最近家里领导安排了一项任务,要从空中课堂网站上批量下载一些教学需要用的文件,做为一名比较懒惰的码农,当然想使用些省力的方法,既能满足领导的要求,又不用自己太费时费事,因此便想用PythonRequests来实现。
整体的思路就是解析HTML代码并找到文件的路径,下载文件并保存到本地。开工后一切顺利,到保存文件这一步卡壳了,为什么下载的文件是乱码?效果如下:
而自己手动通过浏览器下载的文件名却是:三年级语文园地六-3学习任务单.docx。代码其实很简单:
importrequests,cgifile_url=