python中中文

目标：在notepad++中顺利运行python程序

附带解决：notepad++中文下边红线的问题

第一步：下载python和notepad+

建议大家去官网下载：

python windows：https://python.org/downloads/windows

mac ：https://python.org/downloads/mac-osx/

下载后将python放在一个你经常写程序的的盘下，程序员必须有一个自己专用的项目盘。我的是

下载的应用程序放在专用盘,我的是E盘

notepad++

下载地址：https://notepad-plus-plus.org

或者百度notepad++，点击普通下载就行，因为软件特别小。

点击下载notepad++，普通下载

以上是下载方法

第二步：下面我们讲安装方法：

python安装：我的直接安装到专用盘：E:

在E盘确定下载的应用程序都有，大家可以看到NPP开头的就是notepad++，Python很显而易见

notepad++可以随便安装，这个没有要求。界面语言选择中文（简体）

notepad++安装界面

第三步：notepad++运行python环境设置关键步骤

设置之前要求：

1、将输入法换成英文输入法，确定括号、字符都是英文状态下输入。

2、在notepad++中写一个小程序：我写的是:print("nihao,中国")

print("nihao,中国")

3、另存文件为：你好.py

你好.py py是后缀

设置环境：点击notepad++中的运行

或者alt+R

切换成英文输入法在方框中输入：cmd /k E:\python\python.exe "$(FULL_CURRENT_PATH)" & PAUSE & EXIT

注意：E:\python\python.exe 这个是python安装路径

E:\python\python.exe 这个是python安装路径

重要的话说三遍（其它字符看看就行）

在方框中输入 cmd /k E:\python\python.exe "$(FULL_CURRENT_PATH)" & PAUSE & EXIT

先不要着急运行，我们继续按“保存”按钮

点击完保存按钮后，在Name：后面的方框随便写一个名字，以后运行py文件直接可以

在Name中写名字

我在里面设置里好几个快捷键，想按那个按那个，其实一个就够了，不要问我为什么，我就是这么浪。浪里个浪~

点击运行或者alt+R 或者设置的快捷键就可以，切记一定要将鼠标点在notepad++中，要不然你能运行程序就见鬼了。

稍等片刻：不要问我为什么是个黑框框，不愧为慢的像乌龟一样的python，我选择，我愿意！yes，I do.

这下好了，这么点东东我等了五六秒.....心里MMP！

你好中国

题外话：中文字符下有红色波浪线（我就是要浪~~~）

点击notepad++最后最后最后面的ABC按钮

就这样，浪！

Python提取图片中的文字信息，腾讯内部技术，一行代码搞定！行业视频课程

褚君浩

用过手机QQ就知道，点击一个图片会弹出一个小功能，那就是提取图片中的文字。非常方便实用，那么很难实现吗？

利用Python提取图片中的文字信息，只需要一行代码就能搞定！

当然，这是吹牛皮的，但是真正的Python代码也就第4行，说是一行代码搞定也没错。

示例：

效果

尽管运行Python代码后也有几个错误的地方，但是大部分是识别正确的。你以为就这样结束了吗？那这么简单，我都不用出教程了。一行代码实现这个功能当然也是要有前戏的。

一，pytesseract和PIL的安装

pip安装

2，pycharm编辑器能够快速安装，这就看你是否用pycharm了。

pycharm的Settings设置页按照下面步骤操作

安装好了pytesseract，安装PIL在上面第三步里搜索PIL并点击安装就可以了。

安装好了所有库，运行下面Python代码

出现报错

可以看到提示：未安装识别引擎tesseract-ocr

二，安装识别引擎tesseract-ocr

1.网上下载安装包，然后直接点击安装即可

因为tesseract-ocr默认不支持中文识别，所以解压安装tesseract-ocr后还需做如下操作

2，安装完成tesseract-ocr后，我们还需配置好

打开后做如下操作

当然也能由pycharm快速打开pytesseract.py

第一步：

第二步：

第三步：

现在已经完成了所有配置，运行下面Python代码即可实现图片里的文字提取

本文到此就结束了，希望各位Python越学越好，早日达成梦想。

python基于万象优图识别图片中的中文互联网视频课程

傲白

最近一直在研究光学字符识别，即OCR。最开始了解到开源的Tesseract，可以拿来识别简单的英文和数字。但是识别中文的准确率并不高。

然后从Tesseract到Tesseract.js，经过多次尝试研究，最后发现腾讯爹的万象优图识别率是最高的。趁现在是公测免费期，赶紧尝试了一把。

下面来说一说怎么用python实现中文识别的。

首先创建一个bucket，然后可以选择上传图片

这些准备工作做好以后，就开始写代码吧

我们这里，是做图片通用印刷体识别，所以就只有被迫用万象优图提供的API：（原本我是更喜欢用SDK的，因为简单，但是目前SDK不支持）

万象优图OCR接口采用http协议，支持指定图片URL和上传本地图片文件两种方式。

根据用户提供的图片，返回识别出的字段信息。

这里有三点需要注意：

(1) 每个请求的包体大小限制为6MB。

(2) 所有接口都为POST方法。

(3) 不支持 .gif这类的多帧动图。

然后我用可以使用requests模块来发http请求。

这里最麻烦的就是要定制请求头，不然腾讯云是解析不到的，笔者才疏学浅在这里研究了一下午才正确定制出了请求头。。。。

先来看看请求头的规则：

参数名

值

描述

Host

recognition.image.myqcloud

服务器域名

Content-Length

包体总长度

整个请求包体内容的总长度，单位：字节（Byte）

Content-Type

Application/json或者Multipart/form-data

根据不同接口选择

Authorization

鉴权签名

用于鉴权的签名，使用多次有效签名。详情

这里的难点就是这个鉴权签名，直接点击表格里面的详情去看吧，我这里不做复制粘贴。

关于请求参数：

使用image则使用 multipart/form-data格式

不使用image则使用 application/json格式

是否必须

类型

参数说明

appid

必须

string

项目ID

bucket

空间名称

image

可选

binary

图片内容

url

图片的url,image和url只提供一个即可，如果都提供，只使用url

好了，现在开始正式开始吧

先写一下请求头涉及到的变量

然后依次把他们拼接起来

我这里采用的是单次

然后再根据要求进行 HMAC-SHA1加密

这里强调一下，官方的说法是

根据我的研究，转换出来的不是二进制，然后我还特意去转成了二进制。。。。。。发现其实根本不用，转出来的在pycharm里面是个乱码，可以直接用的

最后，加密的数据和之前的拼接数据再拼在一起做base64转码

这样签名就完成了，后面的基本不难，主要就是签名这里有坑，下面直接上代码：

# coding=utf-8# /usr/bin/python# coding=utf-8# create by 15025463191 2017/10/11import requestsimport hmacimport hashlibimport base64import timeimport randomimport reappid = "1254602529"bucket = "imgregnise"secret_id = "AKIDZx72kFVBPRF4324234234o8C1auynPezyl" #我更改了，不要复制我的secret_key = "h9NUN1RbZIm11mJbUt2v32432Zx" #我更改了，不要复制我的expired = time.time() + 2592000onceExpired = 0current = time.time()rdm = ''.join(random.choice("0123456789") for i in range(10))userid = "0"fileid = "tencentyunSignTest"info = "a=" + appid + "&b=" + bucket + "&k=" + secret_id + "&e=" + str(expired) + "&t=" + str(current) + "&r=" + str( rdm) + "&u=0&f=" signindex = hmac.new(secret_key, info, hashlib.sha1).digest() # HMAC-SHA1加密sign = base64.b64encode(signindex + info) # base64转码url = "http://recognition.image.myqcloud/ocr/general"headers = {'Host': 'recognition.image.myqcloud', "Content-Length": "187", "Content-Type": "application/json", "Authorization": sign }payload = { "appid": appid, "bucket": bucket, "url": "http://imgregnise-1254602529.picsh.myqcloud/123456.png"}r = requests.post(url, json=payload, headers=headers)responseinfo = r.contentr_index = r'itemstring":"(.*?)"' # 做一个正则匹配result = re.findall(r_index, responseinfo)for i in result: print i

我这里用图片试验了一次，准备率还是很高的，就是中间少了一个“餐。”

但是这样的识别率已经是很高了

最后预祝各种识别成功！（转自博客园）

· 学IT，就来中公优就业：http://ujiuye/

· 2017年【中公教育】特别推出2017年就业促进计划，500万就业基金助你成为IT达人

详情请戳http：//ujiuye/zt/jycj/?wt.bd=bgz

notepad++下运行python程序及环境设置问题营销视频课程

Fidelia

目标：在notepad++中顺利运行python程序

附带解决：notepad++中文下边红线的问题

第一步：下载python和notepad+

建议大家去官网下载：

python windows：https://python.org/downloads/windows

mac ：https://python.org/downloads/mac-osx/

下载后将python放在一个你经常写程序的的盘下，程序员必须有一个自己专用的项目盘。我的是

下载的应用程序放在专用盘,我的是E盘

notepad++

下载地址：https://notepad-plus-plus.org

或者百度notepad++，点击普通下载就行，因为软件特别小。

点击下载notepad++，普通下载

以上是下载方法

第二步：下面我们讲安装方法：

python安装：我的直接安装到专用盘：E:

在E盘确定下载的应用程序都有，大家可以看到NPP开头的就是notepad++，Python很显而易见

notepad++可以随便安装，这个没有要求。界面语言选择中文（简体）

notepad++安装界面

第三步：notepad++运行python环境设置关键步骤

设置之前要求：

1、将输入法换成英文输入法，确定括号、字符都是英文状态下输入。

2、在notepad++中写一个小程序：我写的是:print("nihao,中国")

print("nihao,中国")

3、另存文件为：你好.py

你好.py py是后缀

设置环境：点击notepad++中的运行

或者alt+R

切换成英文输入法在方框中输入：cmd /k E:\python\python.exe "$(FULL_CURRENT_PATH)" & PAUSE & EXIT

注意：E:\python\python.exe 这个是python安装路径

E:\python\python.exe 这个是python安装路径

重要的话说三遍（其它字符看看就行）

在方框中输入 cmd /k E:\python\python.exe "$(FULL_CURRENT_PATH)" & PAUSE & EXIT

先不要着急运行，我们继续按“保存”按钮

点击完保存按钮后，在Name：后面的方框随便写一个名字，以后运行py文件直接可以

在Name中写名字

我在里面设置里好几个快捷键，想按那个按那个，其实一个就够了，不要问我为什么，我就是这么浪。浪里个浪~

点击运行或者alt+R 或者设置的快捷键就可以，切记一定要将鼠标点在notepad++中，要不然你能运行程序就见鬼了。

稍等片刻：不要问我为什么是个黑框框，不愧为慢的像乌龟一样的python，我选择，我愿意！yes，I do.

这下好了，这么点东东我等了五六秒.....心里MMP！

你好中国

题外话：中文字符下有红色波浪线（我就是要浪~~~）

点击notepad++最后最后最后面的ABC按钮

就这样，浪！