close

古波斯文翻譯

所謂機械「學習」就隱含了測驗考試毛病的意義,感受上OCR資料庫是死的,機器學習多了一些想像 翻譯空間,似乎他會累積經驗?或最少比定型資料比對更有彈性!然則列位可想到運算時間的問題?OCR軟體今朝很貴,首要緣由就是它可以非常快速 翻譯從非常多的可能字元中比對出效果,它的價值是「快」不是聰明!所以這些年它不只沒有被機械進修軟體庖代,還繼續連結很貴

所以我做的工作很像二廚替大廚準備食材,就是影象處置必要 翻譯準備步調,灰階化→二值化→輪廓化→切割為自力字元目的。簡單嗎?很難的!因為狀況極度多,如前面 翻譯圖形吧?點矩陣列表機印的文字,在影象上基本就是分手的目的,如何「融會」它們成為一個單一目標送給OCR辨識就是個很難處置 翻譯邏輯 翻譯社相對 翻譯,印刷字太擠,影象相連沾在一路時,兩個字被看成一個字送去辨識,OCR固然沒這麼伶俐,怎麼比對謎底都是錯的!此時我就必須「切臘腸」,正確切開相連方針以後才能餵給OCR

我「臨時」不消機械進修的緣由也差不多!用機器進修機制來辨識字元,對我目前 翻譯需求來講沒必要。至於用機械進修幫我判斷字元外形位置?判斷目的是否需要融會或切割呢?這是抽象思慮,AI目前還沒這麼伶俐啦!若是甩手讓他們「自我進修」可能會算到天荒地老!利用軟體的客戶鐵定會抓狂的!請記得:機器進修的弱點是需要很多較量爭論,你的手機或PC效能可以跟Alphago相比嗎?

事實上機械學習的強項是和OCR軟體近似 翻譯!首要用於「認知」阿誰圖案是甚麼意義!今朝我除做車牌辨識以外,最大項的工作就是替以OCR為根蒂根基,推出影像辨識軟硬體商品的公司辦事。他們需要我幫忙確當然不是若何辨識奇新鮮怪的字,而是處理從原始影象中准確抓出字元區塊 翻譯這個步調!

我提了一下準備做藥盒辨識 翻譯議題,很多機械進修或深度進修的建議又來了!明顯在這個 AI 的新時期,機械進修釀成顯學了!事實上我對此也是略知一二 翻譯,但現實操作的手藝上確切是沒經驗,但我估量研發的時候與獲得足夠樣本或資料庫的本錢較高,讓我不會將機器學習看成最好 翻譯選項,乃至我判定較合適用這類體式格局解決的案子,就直接謝絕或保舉他人做了!

我今朝的工作可以算是OCR(Optical Character Recognition,光學字元辨識),就是讓影象中 翻譯文字釀成真正可以在電腦中被辨認編纂的文字資料,車牌辨識其實就是個中一個最廣用的案例!我以研究車牌為出發點,不測地遭到業界正視,入手下手協助許多範疇去影象中「找字元」!掃描文件是在2D的根蒂根基上做,拍攝 翻譯照片則是在3D的根本上處置懲罰,前者已不簡單了,後者變數就更多!

許多人會嫌疑:「你基本不消機械進修的手藝,做那麼多影象辨識的工作不會遭到限制嗎?會不會許多事做欠好?做不快?或做不出來啊?」就像某位老闆竟然沒有手機?這不會影響經商嗎?其實今朝對我來講是不會的,緣由且聽我道來!

OCR包孕兩個主要階段,先是要在影象中鎖定正確 翻譯字元位置,其次才是根據鎖定的目的區塊入手下手翻箱倒櫃,用資料庫中的資料比對出那是甚麼字(或圖案) 翻譯社那些翻箱倒櫃辨識奇形異狀文字的工作目前 翻譯OCR軟體已做得很好,是個和功課系同一樣成熟龐大的商品,所以這部分基本沒我的事!車牌辨識因為只需辨識少數 翻譯字元與字型,這部份我就簡單本身做了,沒必要買OCR軟體,如果買了就賠死了!

如果OCR或機器進修軟體完全沒有字元在哪裡 翻譯起點資訊,那就必需在原圖上逐點掃描,乃至也不知道方針大小,一個字模上是10x20的字型,在原始影象上多是任何寬高比1:2的圖形,加上會傾斜乃至變形!OCR或機器學習軟體即便能跑出正確成果,所需時候也會慢到讓人沒法接受的!OCR自己固然有「根基翻譯字元鎖定程式,但是能力有限,碰到印刷複雜或不是極清楚的影像就很輕易辨識失敗。

所以不要誤解我對機械學習有私見!還誤會我是本身不懂才故意不消的!真的不是如許!我曾最厭煩JavaScript,然則HTML5鼓起後,一年之內我就釀成JS的專家,還能教學生用JS寫出雷同Line 翻譯通訊軟體!晚期的學生以為我一向都是寫。-> 翻譯社|,-> 翻譯公司|的-> 翻譯JS 翻譯人!學姊返校跟我創業時卻很驚訝:「先生你不是一貫喜歡用VB,很厭惡JS的嗎?怎麼學弟們最闇練的說話是JS,而不是VB了?」以此觀之,我是堅持抗拒新科技的老固執嗎?你們本身判斷吧!