玖富娱乐平台全网唯一指定1956注册开户网站

【原】Coursera—Andrew Ng机械进修—课程条记 Lect

日期:2019-01-04 浏览:
玖富娱乐是一家为代理招商,直属主管信息发布为主的资讯网站,同时也兼顾玖富娱乐代理注册登录地址。

Lecture 18—Photo OCR 应用实例:图片笔墨辨认

18.1 题目形貌和流程图 Problem Description and Pipeline

图象笔墨辨认须要以下步调:


1.笔墨侦测(Text detection)——将图片上的笔墨与其他情况工具星散开来
2.字符切分(Character segmentation)——将笔墨支解成一个个单一的字符
3.字符分类(Character classification)——肯定每个字符是什么

若是用义务流程图来表达这个题目,每一项义务可以或许由一个零丁的小队来卖力:

18.2 滑动窗口 Sliding Windows

滑动窗口是一项用来从图象中抽取工具的手艺。

倘使须要在图片中辨认行人,起首用很多流动尺寸的图片来练习一个可以或许准确辨认行人的模子。

以后应用练习模子时用的图片尺寸对展望图片举行剪裁,将切片交给模子推断其是不是为行人,然后滑动剪裁地区,剪裁切片后再交给模子推断,直至将图片悉数检测完。
然后按比例放大剪裁的地区,以新的尺寸对图片举行剪裁,将新剪裁的切片按比例缩小至模子采用的尺寸,交给模子推断,云云轮回。


滑动窗口手艺也被用于笔墨辨认,起首练习模子使其可以或许辨别字符与非字符,然后,应用滑动窗口手艺辨认字符。一旦完成了辨认,将辨认得出的地区举行一些扩大,然后将堆叠的地区举行兼并。

接着以宽高比作为过滤前提,过滤高度比宽度更大的地区(由于单词的长度一般比高度要大)。下图中绿色地区是辨认出的笔墨地区,赤色地区是被疏忽的。

下一步是练习模子支解字符,须要的练习集为单个字符的图和两个相连字符之间的图。模子练习完后,依然应用滑动窗口手艺来举行字符辨认。

 

-玖富娱乐是一家为代理招商,直属主管信息发布为主的资讯网站,同时也兼顾玖富娱乐代理注册登录地址。-

末了是字符分类阶段,应用神经网络、支撑向量机或许逻辑回归算法练习一个分类器便可。

18.3 猎取大批数据和人工数据 Getting Lots of Data and Artificial Data

以笔墨辨认应用为例,一种要领是从网站下载种种字体,应用分歧的字体配上种种分歧的随机配景,制造出一些用于练习的实例,可以或许取得一个无限大的练习集。这属于从零开始制造实例。

另外一种要领是,对已有的数据举行修正,比方将其举行歪曲、扭转、隐约处置惩罚。只需以为现实数据有能够和处置惩罚后的数据相似,便可以或许用如许的要领来制造大批的数据。

 某些处置惩罚起不到增添数据集的作用,比方到场高斯噪声、将单个图片复制多份等

在增大数据集之前,必需确保以后练习的已是一个低误差的模子。否则增大数据集也没有用

有关取得更多数据的几种要领: 1.人工数据分解;2.手动网络、符号数据;3.众包

18.4 上限剖析 What Part of the Pipeline to Work on Next

怎样晓得哪一局部最值得花时候和精神去改良呢?可以或许应用流程图举行上限剖析,流程图中每一局部的输出都是下一局部的输入。

在上限剖析中,我们拔取一局部,手工供应 100%准确的输出结果,然后看应用的团体结果提升了若干。倘使以后整体结果为 72%的准确率:
1) 若是让笔墨检测局部100%准确,体系的整体结果从 72%进步到了89%。这意味着很值得投入时候精神来进步我们的笔墨检测的准确度
2) 接着让字符切分结果100%准确,体系整体结果只提升了 1%,这意味着字符切分局部能够已充足好了
3) 末了让字符分类100%准确,体系整体结果又提升了10%,这意味着我们能够也会应当投入更多的时候和精神到分类这局部

另外一个上限剖析的例子,人脸辨认:

其中最值得优化的是:面部检测Face detection,眼部支解Eyes segmentation 和 逻辑回归Logistic regression 三个局部。

发起不要依据直觉,而是应用上限剖析推断应当革新哪一个模块。当把精神花在最值得优化的谁人模块上,会让全部体系的显示有明显的进步。

-玖富娱乐是一家为代理招商,直属主管信息发布为主的资讯网站,同时也兼顾玖富娱乐代理注册登录地址。


平台知识

联系方式丨CONTACT

  • 全国热线:7711177
  • 传真热线:010-88888888
  • Q Q咨询:7711177
  • 企业邮箱:
首页
电话
短信