中企动力 > 头条 > python包在哪下载

网站性能检测评分

注:本网站页面html检测工具扫描网站中存在的基本问题,仅供参考。

python包在哪下载

用Python爬虫一键下载下载美剧,美的不要不要的! 企业视频课程

img

漠河

关注

一直有爱看美剧的习惯,一方面锻炼一下英语听力,一方面打发一下时间。之前是能在视频网站上面在线看的,可是自从广电总局的限制令之后,进口的美剧英剧等貌似就不在像以前一样同步更新了。但是,作为一个宅diao的我又怎甘心没剧追呢,所以网上随便查了一下就找到一个能用迅雷下载的美剧下载网站【天天美剧】,各种资源随便下载,最近迷上的BBC的高清纪录片,大自然美得不要不要的。

虽说找到了资源网站可以下载了,但是每次都要打开浏览器,输入网址,找到该美剧,然后点击链接才能下载。时间长了就觉得过程好繁琐,而且有时候网站链接还会打不开,会有点麻烦。正好一直在学习Python爬虫,所以今天就心血来潮来写了个爬虫,抓取该网站上所有美剧链接,并保存在文本文档中,想要哪部剧就直接打开复制链接到迅雷就可以下载啦。

其实一开始打算写那种发现一个 url ,使用 requests 打开抓取下载链接,从主页开始爬完全站。但是,好多重复链接,还有其网站的 url 不是我想的那么规则,写了半天也没有写出我想要的那种发散式的爬虫,也许是自己火候还不到吧,继续努力。。。

后来发现,其电视剧链接都是在文章里面,然后文章url后面有个数字编号,就像这样的http://cn163/archives/24016/,所以机智的我又用了之前写过的爬虫经验,解决方法就是自动生成url,其后面的数字不是可以变的吗,而且每部剧的都是唯一的,所以尝试了一下大概有多少篇文章,然后用range函数直接连续生成数来构造url。

但是很多 url 是不存在的,所以会直接挂掉,别担心,我们用的可是 requests ,其自带的 status_code 就是用来判断请求返回的状态的,所以只要是返回的状态码是404的我们都把它跳过,其他的都进去爬取链接,这就解决了 url 的问题了。

以下就是上述步骤的实现代码。

def get_urls(self): try: for i in range(2015, 25000): base_url = 'http://mitedu/' url = base_url + str(i) + '/' if requests.get(url).status_code == 404: continue else: self.save_links(url) except Exception, e: pass

其余的就进行的很顺利了,网上找到前人写的类似的爬虫,但是只是爬取一篇文章的,所以借鉴了一下其正则表达式。自己用了 BeautifulSoup 还没有正则效果好,所以果断弃了,学海无涯啊。但是效果也不是那么理想,有一半左右的链接不能正确抓取,还需继续优化。

编程派:下面的代码中 reload(sys);sys.setdefaultencoding('utf-8') 的做法是不推荐的,容易产生错误。

# -*- coding:utf-8 -*-import requestsimport reimport sysimport threadingimport timereload(sys)sys.setdefaultencoding('utf-8')class Archives(object): def save_links(self, url): try: data = requests.get(url, timeout=3) content = data.text link_pat = '"(ed2k://|file|[^"]+?.(Sd+)(Ed+)[^"]+?1024Xd{3}[^"]+?)"' name_pat = repile( r'

(.*?)

', re.S) links = set(re.findall(link_pat, content)) name = re.findall(name_pat, content) links_dict = {} count = len(links) except Exception, e: pass for i in links: links_dict[int(i[1][1:3]) * 100 + int(i[2][1:3])] = i # 把剧集按s和e提取编号 try: with open(name[0].replace('/', ' ') + '.txt', 'w') as f: print name[0] for i in sorted(list(links_dict.keys())): # 按季数+集数排序顺序写入 f.write(links_dict[i][0] + '') print "Get links ... ", name[0], count except Exception, e: pass def get_urls(self): try: for i in range(2015, 25000): base_url = 'http://cn163/archives/' url = base_url + str(i) + '/' if requests.get(url).status_code == 404: continue else: self.save_links(url) except Exception, e: pass def main(self): thread1 = threading.Thread(target=self.get_urls()) thread1.start() thread1.join() if __name__ == '__main__': start = time.time() a = Archives() a.main() end = time.time() print end - start

完整版代码,其中还用到了多线程,但是感觉没什么用,因为 Python 的 GIL 的缘故吧,看似有两万多部剧,本以为要很长时间才能抓取完成,但是除去 url 错误的和没匹配到的,总共抓取时间20分钟不到。搞得我本来还想使用 Redis 在两台 Linux 上爬取,但是折腾了一番之后感觉没必要,所以就这样吧,后面需要更大数据的时候再去弄。

还有过程中遇到一个很折磨我的问题是文件名的保存,必须在此抱怨一下, txt 文本格式的文件名能有空格,但是不能有斜线、反斜线、括号等。就是这个问题,一早上的时间都花在这上面的,一开始我以为是抓取数据的错误,后面查了半天才发现是爬取的剧名中带有斜杠,这可把我坑苦了。

python中解析网站的图片地址并下载 企业视频课程

img

阿普里尔

关注

python之所以那么火爆,很大一部分原因就是因为python可以很随意地下载网站中的源码,并解析网站的结构,从而获得自己希望得到的数据。今天我们就一起来聊聊如何用python下载网站中的图片。

首先,你需要解析网页中的源码:

然后会得到一个list0列表,这个列表中存储的都是网页文件,之后遍历网页文件,得到的图片下载链接,直接点击链接就可以下载图片了.

python django 实现文件下载功能 推广视频课程

img

解脱

关注

在前面的文章中讲述了用python实现文件上传,操作文件属性,这篇文章给大家展示django框架下如何实现文件下载。

最简单的下载方式:

django中最简单的下载方式

这种方式适合文件小的时候,若文件非常大,就很耗内存。

django中的HttpResponse对象是可以将迭代器作为参数传递,因此可以将上面的c替换成迭代器,这样就防止文件过大时下载失败的问题。

但在django中,更推荐使用StreamingHttpResponse对象,它将文件以流的形势发送给浏览器。

查看django框架源码比较HttpResponse和StreamingHttpResponse:

HttpResponse源码

streamingHttpResponse源码

源码中注释的很明确,httpResponse是将一个字符串作为内容返回。streamingHttpResponse是将内容以迭代器的形式返回给客户端。

因此,修改上面的代码,将读取文件写成迭代器,然后将这个迭代器作为参数传给streamingHttpResponse对象:

django实现文件下载功能

大家已经看到上面上面多了两行代码:

这个是定义文件流的格式类型,response['Content-Type'] = 'application/octet-stream',是二进制流数据(常用文件下载)

response['Content-Disposition'] = 'attachment;filename="xxx",是设置显示的文件名。

至此,文件下载功能已实现。

扩展思路:

若想限制用户下载,只允许有权限的用户下载,该怎么做呢?

Python3入门——下载安装Python 3.7.0 企业视频课程

img

Nina

关注

学习Python第一步:安装好Python。本文只介绍Windows 10系统下的安装。

第一步:下载

前往 https://python.org 进行下载

第二步:安装

双击运行下载好的 python-3.7.0.exe 文件

结束:安装完成

打开命令行查看是否安装成功。成功如下:

注意:如果上述第二步中未勾上 “Add Python 3.7 to PATH”,那么命令行提示 “’python’ 不是内部或外部命令,也不是可运行的程序或批处理文件。”

-结

Python环境搭建—手把手教你如何安装Python和Pycharm详细教程 流量视频课程

img

Hana

关注

人生苦短,我用Python。众所周知,Python目前越来越火,学习Python的小伙伴也越来越多。最近看到群里的小伙伴经常碰到不会安装Python或者不知道去哪下载Python安装包等系列问题,为了方便大家学习Python,小编整理了一套Python和Pycharm安装详细教程,只要大家按照这个步骤来,就可以轻松的搞定Python和Pycharm的安装了。

Python具有跨平台性,它几乎可以在任何平台下运行,如:Windows/Unix/Linux等操作平台上。大部分的小伙伴用的是Windows,在此小编就以Windows平台为例,详解Python和Pycharm安装过程。

一、Python安装过程

工欲善其事,必先利其器。首先我们先来安装Python,在这里安利一下:其实在没有安装Python之前也可以安装Pycharm的,两者并没有什么冲突关系。但是话说回来,如果没有Python编译器,那么Pycharm其实只是个驱壳,即便你编好程序之后,也并不能运行。举个栗子,Python相当于子弹,Pycharm相当于手枪,如果手枪没有子弹的话,那它就没有走火的可能性。从逻辑上来讲,还是应该先安装Python的,具体流程如下:

1、首先进入Python的官网:https://python.org,之后选择下图框框内的文件进行下载:

当然你也可以直接进入网址:https://python.org/downloads/,选择对应的Windows安装包,进行文件下载即可,如下图所示:

2、下载Python。其中Python2和Python3版本都可以下载,两者是兼容的。在这里,小编以Python3版本的安装为例,下载后如下图所示:

3、安装Python。双击python-3.6.4.exe文件,之后按照框框内的指示进行选择,记得勾选两个框框,然后选择Customize installation进入到下一步:

4、之后进入以下的界面,默认即可,直接选择下一步:

5、之后进入下图界面,点击Browse可以进行自定义安装路径,千万要记得自己把它安装在哪个盘下面,当然你也可以直接点击Install进行默认安装,点击Install后便可以完成安装了。本例中,小编把它安装在C盘,之后点击Install,稍等片刻之后,便可以实现Python的安装了。(注意:要记得Python的安装路径)

在安装过程中如果弹出任何提示的话,选择确定或者允许操作就可以了。

6、安装完成之后在开始菜单中输入cmd命令,进入命令行窗口,然后在窗口中输入python进行验证。如果出现下面两张图的提示,就说明Python安装成功了。

如果你看到提示符>>>,就表示我们已经在Python交互式环境中了,此时你可以输入任何Python代码,回车后会立刻得到执行结果。现在,输入exit()并回车,就可以退出Python交互式环境(直接关掉命令行窗口也可以)。

7、如果出现下图的提示,则说明安装失败了:

出现这个错误的原因是因为你在安装的时候漏掉了勾选Add python.exe to Path这个选项,此时就要手动把刚刚安装所在的路径添加到Path中。如果你不知道怎么修改环境变量,建议把Python安装程序重新运行一遍,记得勾上Add python.exe to Path这个选项就可以顺利安装了。

接下来我们安装开发环境Pycharm,至于为神马选择Pycharm,可以戳这篇文章(企业级开发大佬告诉你学习Python需要用什么开发工具)。

二、Pycharm安装过程

1、首先去Pycharm官网,或者直接输入网址:http://jetbrains/pycharm/download/#section=windows,下载PyCharm安装包,根据自己电脑的操作系统进行选择,对于windows系统选择下图的框框所包含的安装包。

2、选择Windows系统的专业版,将其下载到本地,如下图所示:

3、双击下载的安装包,进行安装,然后会弹出界面:

4、选择安装目录,Pycharm需要的内存较多,建议将其安装在D盘或者E盘,不建议放在系统盘C盘:

5、点击Next,进入下图的界面:

Create Desktop Shortcut创建桌面快捷方式,一个32位,一个64位,小编的电脑是64位系统,所以选择64位。

勾选Create Associations是否关联文件,选择以后打开.py文件就会用PyCharm打开。

6、点击Next,进入下图:

默认安装即可,直接点击Install。

7、耐心的等待两分钟左右,如下图:

8、之后就会得到下面的安装完成的界面:

9、点击Finish,Pycharm安装完成。接下来对Pycharm进行配置,双击运行桌面上的Pycharm图标,进入下图界面:

选择Do not import settings,之后选择OK,进入下一步。

10、选择Accept,进入下一步:

11、进入激活界面,选择第二个License server,如下图所示:

之后在License server address中随意输入下面两个注册码中的任意一个即可,Pycharm新注册码1:http://idea.liyang.io或pycharm新注册码2:http://xidea.online,之后点击OK,便可以激活Pycharm了。

12、Pycharm激活后

13、激活之后会自动跳转到下图界面,选择IDE主题与编辑区主题:

建议选择Darcula主题,该主题更有利于保护眼睛,而且看上去也非常不错~~~

14、选择OK之后进入下图界面:

选择Yes即可,更换IDE主题。

15、之后进入下图界面:

16、点击Create New Project,进入如下图的界面:

自定义项目存储路径,IDE默认会关联Python解释器。选择好存储路径后,点击create。

17、IDE提供的提示,直接close即可,不用理会。

18、进入的界面如下图所示,鼠标右击图中箭头指向的地方,然后选择New,最后选择python file,在弹出的框中填写文件名(任意填写),本例填写:helloworld。

19、之后得到下图,然后点击OK即可:

20、文件创建成功后便进入如下的界面,便可以编写自己的程序了。

这个界面是Pycharm默认的界面,大家完全可以自己去setting中设置自己喜欢的背景和字体大小、格式等等。

在这里我就不一一赘述了,起码到这里我相信大家已经实现了Pycharm的安装了。

21、Pycharm中的部分快捷键

1、Ctrl + Enter:在下方新建行但不移动光标;

2、Shift + Enter:在下方新建行并移到新行行首;

3、Ctrl + /:注释(取消注释)选择的行;

4、Ctrl+d:对光标所在行的代码进行复制。

最后小编祝大家能够顺利的完成Python和Pycharm的安装,^_

python中解析网站的图片地址并下载 营销视频课程

img

崔元晖

关注

python之所以那么火爆,很大一部分原因就是因为python可以很随意地下载网站中的源码,并解析网站的结构,从而获得自己希望得到的数据。今天我们就一起来聊聊如何用python下载网站中的图片。

首先,你需要解析网页中的源码:

然后会得到一个list0列表,这个列表中存储的都是网页文件,之后遍历网页文件,得到的图片下载链接,直接点击链接就可以下载图片了.

img

在线咨询

建站在线咨询

img

微信咨询

扫一扫添加
动力姐姐微信

img
img

TOP