uu快三

datasheet

QbitAI量子位

文章數:1736 被閱讀:20496473

最新活動更多

Nexperia ESD 應用手册|读 ESD 干货答题赢好礼
免費申請英飛淩FMCW雷達解決方案Position2Go,角度,距離,速度,運動方向檢測一板搞定!
答题有礼|一起学习 Mentor PCB 手册
TI汽車方案拼圖,你敢挑戰嗎?
TTI&TE直播:傳感器在工业电机里的发展及最新應用
答题有礼|罗彻斯特电子带你解锁半導體全周期难题
【看NI案例分析,答题有礼】现代汽车旗下Hyundai Kefico的动力总成ECU功能测试方案
TI E2E™ 中文社区8周年,8本技術合集送给热爱技術的你!

更多最新新聞

  • e絡盟新型選擇器助力客戶精准選取適配烙鐵頭
  • Sanjay Rohatgi就任NetApp高级副总裁兼亚太区总经理
  • 为电机驱动器提供高功率密度 Infineon 逆变器模块贸泽开售
  • Nordic Thingy:91—简化的蜂窝物聯網原型开发
  • 技術文章—了解电机驱动的真空机器人的世界
  • 儒卓力在蓝牙技術方面继续扩大市场
  • 優異的穩定性和散熱性,Vishay新款IHDM邊繞電感器問市
  • 中國車聯網十年爭奪,痛點未除,變數叢生
  • 關于Mobileye,你或許還不知道的事
  • Hot Chips:英特尔推动“人工智能无处不在”

最新精華更多

  • 1 淺析浮點數
  • 2 漫談電路、信號處理中的“虛部”
  • 3 人生苦短,我用Micropython...
  • 4 雙手撸碼20+天,串口軟件(visu...
  • 5 徒手編寫了一個STM8的反彙編工具
  • 6 2017年大学生电子竞赛F题 方案级...
  • 7 格物致知01——拍頻
  • 8 C語言char字符串與中文編碼的坑
  • 9 漫話有源濾波器——低通濾波器篇
  • 10 漫話有源濾波器——高通濾波器篇

賬號入駐

一支筆的AI之旅

2019-08-12
    閱讀數:
乾明 发自 凹非寺?
量子位 报道 | 公众号 QbitAI

你知道地球上物種大爆發的時代嗎?

現在就很像。

但不是生物物种,而是AI带来的一个又一个新硬件、新産品和新物种。

一切正在被重新定義,小到一支筆,大到一家公司,再大到整個行業。

我們今天從一支筆的AI奇幻之旅說起。

一支筆,AI加持

碰到不認識的英文單詞,你會怎麽辦?

掏出來電子詞典?打開手機上的App查?還是搬出“牛津詞典”?

現在有AI,只需要拿著筆掃一下,不需要輸入就能查單詞。

整個過程,只用了大概1秒鍾的時間,要比翻紙質詞典,用電子詞典以及手機快多了。

而且, 再长也能扫出来,比如这个单词:

supercalifragilisticexpiadocious。

出现在一部名叫Mary Poppins的电影里,意思是“好”。


翻譯的質量上也有保證,還能自動把單詞念出來,讓人感受發音。整個過程,不需要聯網也能完成。

還能翻譯一句話:

這支筆,是網易有道新推出的AI硬件網易有道詞典筆2.0

在8月底,將會OTA升級,在目前離線查單詞和整句翻譯的基礎上,推出整段翻譯的功能。

但打造这样一支AI之笔,并不容易,时也运也,赶上AI复兴,技術条件依然具备。

AI大爆炸

AI複興,世人皆曉AlphaGo,另一個標志性變革鮮有人知。

也是2016年,一款AI産品悄然上线,不同于AlphaGo带来的冲击,但它让每一个人都能真正体验到AI的能力、实力和便利。

它就是首個基于神經網絡翻譯的機器翻譯系統問世。

不同于基于統計的傳統機器翻譯方法,神經網絡機器翻譯能夠自動從語料庫中學習翻譯知識,從而實現了翻譯質量的”跨越式“發展。之後神經網絡機器翻譯便成爲主流翻譯工具的核心方法,融入了人們生活之中。

不過,這只是前奏。

整个AI技術方向上,计算机视觉、语音识别、自然语言处理、机器人等等都有了惊人突破,机器已经在图像识别、语音识别等多个方面超越普通人类水平。

与此同时,掌握成熟AI技術的公司,开始思考怎样把AI进一步落地,实现其商业价值。

而教育领域,网易有道借势而起,结合已有场景,加持前沿技術,打造全新硬件産品,最后解决实际难题……

網易有道詞典筆2.0,正是其中缩影。

它主打的功能,是每秒查一個單詞:

與”傳統的”查單詞方法相比,核心原因是省略了人”輸入“單詞給機器的過程,而且由機器將單詞輸入給機器。

具體來說,它的筆頭是一個高速攝像頭,核心作用是在用戶提筆掃單詞的時候,每秒拍攝100多張圖像。

這圖像……太碎了,對于機器來說,根本不可能理解,更遑論翻譯?

要用AI把它們拼起來再給機器看,整個拼接過程難點不少,並不是任何一家公司都能夠駕馭。

首先,文本圖像的拼接問題

與正常處理的圖像不同,使用高速攝像頭拍攝下來文本圖像紋理特征通常較少。

通常用于完成拼圖任務的基于尺度不變特征匹配方法,很容易對不同的文字圖像生成相同的特征描述子,從而引發誤匹配導致拼圖失敗。

为了解决这个问题,网易有道根据实际應用场景自行设计了一套特征,从而用自定义的方式快速提取特征。相比传统SIFT花1毫秒提取单张图像的特征,有道定制化的提取方法要高效很多。

總體而言,詞典筆2.0所采用的圖像拼接方法可以分爲圖像配准、圖像融合與文本切行三大步驟。

此外,他們也對算法上進行了很多優化,比如文字的加測、樣本的矯正等等,進一步提升掃描圖像的拼接准確度。

其次,用戶掃描不規範的問題

这支笔,是一个面向C端用户的産品,使用者是有各种习惯的用户,他们扫描的过程中持笔的角度、滑动的速度以及抖动都会影响图像匹配。如果使用传统的图像特征匹配方法,很容易造成误匹配和高延时。

網易有道介紹稱,他們設計的多特征圖像匹配算法,能夠充分挖掘上述場景的圖像對親關系,從而支持最高240mm/s的掃描速度,與桌面夾角成90度至60度的掃描角度,拼圖成功率高達98%。

此外,他们通过綜合所有字符检测位置对用户扫描的行样本进行组行、矫正、切分,来解决用户持笔扫描抖动的问题,也支持一定距离内的左右滑动。

至于不同掃描文本的字體不同、背景不同等問題,他們也在模型訓練過程中擴充上述場景的素材,極大地增強了模型的泛化能力,也在拼圖階段使用圖像處理方法對全景圖像進行了去燥使得文本特征更加突出。

除了上述的自適應全場景拼接功能,他們還實現了流式識別計算——即在掃描拼接圖像的同時,將內容提取出來,交由神經網絡去翻譯。

通过种种优化,网易有道最后实现了95.5%的綜合准确率,而业内平均水平不过82%。他们表示,这一成绩超越了竞品。

網易有道憑什麽?

網易有道歸去來

有道,一开始是一款搜索産品,定位是网易自主研发的中文搜索引擎。

在搜索领域7年的耕耘,为其在大规模数据存储计算等领域留下不少技術储备。

2013年,有道选择将精力从搜索业务上收回,专注于语言翻译應用与服务、个人云應用和电子商务导购服务等三个方向。

最核心的,是语言翻译應用与服务方向的业务。

2006年12月,在搜索业务上线的同时,网易有道也推出了海量词典産品,而且一直在有更新推进:

2007年12月,有道詞典桌面版正式上線,2009年1月,有道詞典首個手機版本上線。

10多年发展至今,网易有道词典已经官宣有8亿+用户,成为国内最大词典應用之一,这样也给网易有道的技術研发积累了大量数据。

在发展过程中,网易有道也在不断拓宽业务边界,推出有道云笔记、有道精品课等一系列産品,涉足在线教育市场。

虽然网易有道没有抓住搜索的浪潮,但在神经网络重塑整个行业的时候,它抓住了,并在光学字符识别技術和神经网络翻译方面,建立了优势,这也是在线教育领域最为核心的两大AI技術。

2016年,谷歌上线神经网络機器翻譯系統的那年,网易有道首席科学家段亦涛开始带队研发神经网络翻译技術,并在2017年将有道翻译升级为神经网络机器翻译引擎。

现在,有道神经网络機器翻譯系統,支持中文与英日韩等12个语种直接互译,9种语言的英文互译。

在准確度上,也達到了業內領先的水平。

根據網易有道披露的數據,2019年7月的測評中,網易有道的神經網絡翻譯引擎在大小寫不敏感的情況下,新聞領域測試集上的BLEU-4得分已經超過谷歌和微軟。

2017年,网易有道也开始使用基于神经网络的OCR技術,在互联网教育行业中持续进行技術渗透和迭代更新。

網易有道宣稱,現在,其已支持26種語言文字識別,也能進行語種自動判別和混合識別,准確率達99.6%,是目前國內識別語言最多的OCR識別引擎。

除了常规识别场景,针对教育场景,他们还对OCR技術进行了优化,比如公式识别:

准確率達到93%,可以實現轉LaTeX功能,並在此基礎上研發出了機器自動解方程功能。

此外,还支持拼音、绘本、模糊字等特殊文本的识别,平均准確率達95%。而且,在提供线上服务的同时,有道OCR引擎还支持端侧的离线模型部署,大小为50M。

在语音识别与合成与自适应学习的技術研发上,网易有道也已投入大量资源进行研发工作。

其中,语音识别技術在一些场景上准确率超过98%,支持中、英、日、韩多个语言,语音合成引擎也已经支持中、英、日、韩、葡等多个语言。

自適應學習方面,已經能夠配合智能硬件,實現實時采集書寫數據,提供學情分析、知識圖譜評估等一系列自適應學習輔助功能。

这些技術积累,正是网易有道“站出来”、拿出解决方案的原因。

从2017年开始,网易有道也开始推动AI技術落地。一方面通过有道智云,向企业用户输出能力,合作伙伴有华为、小米、OPPO、联想、努比亚、步步高、优学派、读书郎等。

另一方面,也开始寻找场景,面向消费者推出AI硬件。从2017年10月推出翻译蛋以来,已经有8款産品問世。

現在,網易有道是一家什麽公司?CEO周楓說,是一家全鏈條的教育科技公司。接下來要做的是探討“教育與科技的結合”。

這是整個行業的大勢所趨,也是網易有道的機會。

因为变革时代已来,新技術催化,硬件新物种频出。网易有道这样的公司,也会越来越多从“幕后”来到台前。

在AI浪潮中,你還能舉出類似的公司嗎?

AI社群 | 与优秀的人交流

AI内参 | 关注行业发展

量子位?QbitAI · 头条号签约作者

?'?' ? 追踪AI技術和産品新动态

喜欢就点「在看」吧 !?


最新有關QbitAI的文章

About Us 關于我們 客戶服務 聯系方式 器件索引 網站地圖 最新更新 手機版

站點相關: TI培訓

北京市海澱區知春路23號集成電路設計園量子銀座1305 電話:(010)82350740 郵編:100191

電子工程世界版权所有 京ICP證060456號 京ICP備10001474號 電信業務審批[2006]字第258號函 京公海網安備110108001534 Copyright ? 2005-2018 EEWORLD.com.cn, Inc. All rights reserved