• 2018-08-15 01:30:26
  • 阅读(14821)
  • 评论(12)
  • 原标题:​谷歌查找,智能仍是风险?

    记住上个星期,人民日报被删的那条Twitter 闹了不小风云。。

    惋惜虚晃一枪,什么也没有发作,却是李彦宏的那条朋友圈很有意思~

    李总对百度的技能十分有决心,并自认为在我国,凭仗技能和立异方面能够打败谷歌,并不忧虑谷歌入华。

    成果转天就被网友们打脸。。。

    百度上的“ 滑嫩”、“ 新鲜” 等满是美人图片,而谷歌上查找这些内容,呈现的则是一些美食等。emmm。。高低立判。。。

    被爆料后,百度程序猿们加班加点,总算是把咱们揪出来的灵敏词汇处理了。

    但是,今日发作的一件事,让差评君意识到,不仅仅是查找算法,谷歌在别的一个方面早就超过了百度。。。

    下午差评君在查询黑产,用百度查找了一个QQ 号,网页版的内容根本就是胡乱凑的,而图片查找空空如也,什么成果也没有。

    不死心的差评君又用谷歌试了一下,成果。。。

    给你们看一下大图。。。

    竟然真的把差评君想要的查找了出来,并且,由于这个QQ 触及黑产,所以骗子只把它放在图片里,并没有放到网页上。

    也就是说,Google 现在现已开端对互联网上淘券联盟的图片文本做了辨认提取,并树立索引!

    在咱们的印象中,查找引擎一般会根据图片周围的文字描述给图片打标签,或许运用神经网络辨认图片上的物体,并不会扫描读取图片上的文本内容。

    用神经网络给图片分类

    所以许多时分你查找图片上的文本,查找引擎不会给你回来正确成果。

    不知道什么时分,谷歌现已偷摸给自己的查找引擎升了个级!?

    为了看一下谷歌的图片辨认文本现已到达什么程度,差评君敞开了张狂验证形式。。。

    首要,要验证下,是不是图片上数字都能够被辨认出来~

    Emmm,先搞一个身份证号查找看看。这个是百度的成果:

    再用谷歌查找一下?

    额。。有没有感到一丝丝惧怕?!想想自己有没有曾经在网上上传过身份证相片?假如被走漏到互联网上,能够直接通过身份证号取得身份证图片,这成果有点b2b电子商务平台严峻。

    差评君借用了一个小伙伴的身份证前几位,分别在百度和谷歌上查找“ 1201031993 ”,百度仍然什么也搜不出来,而谷歌回来了一堆成果。

    这些图片上无一例外的有1201031993 这几个数字。。。

    令差评君意外的是,谷歌在对图片文本提取时,现已不仅仅是用的最简略最根底的图像辨认。

    像上面第二张图片中那几个数字是竖过来,但谷歌仍旧辨认正确,阐明谷歌的辨认算法会主动匹配文本的旋转视点。

    假如不是纯数字,带上英文呢?只在图片上有,网页上没有呈现过的文本还真不好找,最终差评君试了个汽车图片,把车牌号“ A·K8896 ” 搜了一下。

    嗯,百度出来的都是八棍子撂不着的图片,正常。

    那,谷歌呢。。?

    咱们也能够试试自家的车牌能不能被搜到

    给,这是差评君十年份的膝盖,请收下。。。

    这张图片正是差评君随机找的一张汽车图片,谷歌这项技能,连躲藏在车身下不那么显着的车牌号都揪了出来,够强壮。

    最终一个问题,谷歌能不能辨认图片中的中文?

    通过实验,还好还好,中文现在仍是谷歌图片未霸占的堡垒,现在看来,谷歌只对图片中的字母和数字进行了辨认。

    查找了文中第一个比如中图片的中文,没有回来该图片

    不过差评君猎奇的是,谷歌查找引擎是什么时分开端辨认图片文本的?

    谷歌没有给出过官方消息,相关的评论也屈指可数,2016 年的时分谷歌的大佬还否认过谷歌在辨认图片文本。

    不过在上一年7 月的时分,有一个博客主跟差评君有类似的发现,所以至少上一年谷歌就现已悄悄升了级~

    其实,谷歌很早就积累了图片的文本辨认相关技能—— OCR ( 光学字符辨认)。

    这个技能自身并不难,最早谷歌将OCR 应用在书本扫描转换文本上,这样只需你查找书中的一句话,它就能推给你正确的书本。

    谷歌解析图片文本的专利

    现在,谷歌现已将这项技能应用在互联网的一切图片上。

    差评君之所以感到惊奇,是由于咱们每天要发生很多图片,光在Facebook 和Instagram 上每天就发生近4 亿张图片,微博上每天发生1.5 亿张图片,保存估量互联网上每天要多出8 亿图片。

    而谷歌对每张图片都进行OCR 算法处理,获取里边的文本信息,这是一项海量的工程,耗费太大了。但谷歌仍是做到了。

    Google 实时翻译也是用的OCR 技能

    这样大大提高了咱们运用查找引擎的功率,让咱们更简单找到自己想要的成果~

    不过在曾经,正是由于咱们默许查找不出图片上的文本,才会定心的把一些材料保存成图片放到网上。

    现在跟着这项技能的老练,恐怕图片也不再稳妥。。。谁能想到一个身份证号,就把身份证图片都搜出来了呢?

    怎么统筹技能和隐私,恐怕未来需求谷歌好好处理一下~

    iiiiiiiiii

    ​图片来历:1. 新视角,李分明2. 北美留学生日报3-5、7-15. 差评6. damon  16. Techgyst

    参考材料:

    1.《用谷歌和百度一起查找“新鲜、滑嫩、胸膜”等词后…李彦宏赢了》,北美留学生日报

    2.《 Google: No, We Don't Understand Text In Images 》,Barry Schwartz

    3.《 How Much Data Do We Create Every Day? The Mind-Blowing Stats Everyone Should Read 》,Bernard Marr

    4.《Does Google Read Text in Images? NEW Evidence Says Yes!》,Steve Toth

    5.《互联网上一天发生的流量,到底有多少?》,财经头条

    iiiiiiiiii

    “ 吓得我赶忙把微博里边的图片都删了。。 ”

    来源:版权归属原作者,部分文章推送时未能及时与原作者取得联系,若来源标注错误或侵犯到您的权益烦请告知,我们会及时删除。联系QQ:110-242-789

    39  收藏