隨著AI應用在智能手機落地,手機翻譯已經成為了很多人的剛需,而在手機翻譯中,目前做的最好最完善的,當屬華為。
最新發布的華為Mate30 系列在全屏翻譯的基礎上,又帶來了滾屏翻譯。只需三個步驟,即可實現多屏內容實時翻譯:
1、雙指長按屏幕內容;2、點擊“【全屏翻譯】;3、點擊【滾屏翻譯】。
據了解,EMUI10 全屏翻譯解決了外文翻譯的難題,但是如果想要翻譯多屏內容,需要一次又一次進行全屏翻譯的操作。
隨著內容長度的增加,操作的繁復還會使閱讀的連貫性降低。如此一來,滾屏翻譯便派上了用場。
據悉,EMUI10 滾屏翻譯支持各種應用、十種語言、多屏內容的翻譯。使用小藝語音口令 “幫我翻譯屏幕”或雙指按壓屏幕即可使用。
按照官方說法,當你瀏覽一篇長文章需要翻譯時,系統會先將其滾動截屏,形成一張原文的長截圖,然后對長截圖進行切分、文本檢測、翻譯、排序、去重、拼接,最后以同樣的圖片和翻譯完成的文字,再次呈現在你的面前,這就是滾屏翻譯。
在對長截圖進行初步處理的過程中,會用到OCR,即光學字符識別(Optical Character Recognition)技術。也就是對原來長文章形成的長截圖上的文字,進行識別提取,將它們提供給后續的機器翻譯環節使用,也就是完成了長篇源文字提取的過程。
從技術原理上為檢測和識別兩段式算法框架,涉及中、英、日、韓、俄、西、法、德、意、葡十種語言識別能力,包含多個運行于NPU(Neural-network Processing Unit,神經網絡處理單元)的深度模型。
翻譯得準不準,依賴于OCR識別的準確性;翻譯得快不快,依賴于OCR處理字符速度的快慢,而這些主要取決于華為Mate30 系列的NPU算力。