跳到主要內容

透過Deep neural network來協助機器視覺判讀QR碼

經由 laisan86 提問 ‧ 70 天前

辨識技術類(影像、圖片、臉部識別等) AIx視覺:影像辨識無所遁形

QR碼全名叫做Quick Response Code,目前很多人都叫它二維條碼,可是其實QR碼只是二維條碼的一種而已!形形色色的商品在外包裝上印製出來,方便櫃台結帳時使用。QR碼會普及主要除了快速讀取、更大儲存資料容量之外,更重要的是QR碼不必像是傳統一維條碼一般,得要讓掃描器對準條碼才行正常操作。

可是,有利就有弊!QR碼的解讀分成兩個步驟 ==>

Localization
Decoding
QR碼的左上,右上,左下三個大型的如『回』的黑白同心方塊,就是辨識定位標記。這樣一來,拍照的時候不管是甚麼樣的角度,只要可以定位到QR碼,那都有機會能解讀!問題也同時因應而生:失去任何一個定位標記都會影響辨識效果,因此第一步驟Localzation就是在指定位這件事情。況且,拍照品質如果未達一定要求,QR碼的解讀效果當然也跟著降低

綜合以上假如賣場零售商品因為QR碼辨識需要一定時間,這對於營業來說是很不利的,可是如果利用Deep neural network的演算法,把一個QR碼拆解成不同區塊,每個塊由各自的DNN單獨處理,根據機率對於各自的區塊形成識別找出QR碼可能出現的位置,拼湊起來,辨識的時間應該可以有效縮短

回答 2

經由 omnixri 回答 ‧ 70 天前

這似乎是一個有趣的議題,但市售商品好像沒人用二維條碼(QR Code),工業界產品倒是比較常見,或許未來随著食安問題會間接促成二維條碼導入一般商品。

一般常見二維條碼掃碼機用的MCU(或專用IC)等級不高,甚至只有8bit,若改用深度學習方式定位QR Code位置進而解QR Code,不知道要用何種級數MCU才能解,又需要花多少時間解?是否能更有效縮短辨識時間,更容易辦識,就有待考驗了。

目前一般二維條碼機(或手機上APP)只能同時掃一組CODE,若採用深度學習方式可用更小的解析度,同時(同畫面)可掃多組QR Code,應用於一桌子的商品同時結帳,或許是不錯的賣點吧?

經由 laisan86 評論 ‧ 69 天前

一次可以掃描多個QR碼這個是個不錯的想法! 事實上, 像是大型的物流倉庫、運輸業者也會用上. 好比說貨運的貨櫃, 如果有QR碼可以掃描, 很容易可以知道目前哪個貨櫃是給哪一台車, 甚至是哪個司機給拖走了, 除了知道貨物吞吐量以外, 也可以作為效率管理的指標 ==> 車頭有自己的QR碼、貨櫃有自己的QR碼, 攝影機從高處拍攝, 再一次性地針對多個QR碼去得知組合, 就可以了!

經由 chuckmails 回答 ‧ 68 天前

這個台大有人在做喔可以在IEEE的論文查詢到,的確就是利用深度學習的方式去辨識各種QR code 。除了樓主說到的可以加快辨識速度以外,在遇到模糊的圖片或是角度過大的狀況也都可以透過深度學習的方式嘗試重建辨識,期待他們未來可以實際應用在產業上~

下面這張圖是他們辨識各種複雜背景、低解析的QR code,成果十分厲害!

參考出處:QR code detection using convolutional neural networks 作者:Tzu-Han Chou ;Chuan-Sheng Ho ;Yan-Fu Kuo

經由 laisan86 評論 ‧ 68 天前

沒錯! 一個鏡頭照到多個QR碼, 個別解譯之後, 再套用實際場景就可以做到把很多事情一次解決. 結帳也可以考慮! 因為不少人結帳的時候, 是一堆東西, 這些東西如果照目前像是家樂福等大賣場, 採用一維條碼會得要對準到一定的程度才可以辨識, 假如櫃台一次可以多個QR碼, 那結帳可就方便不少了. 當然, 還是得要有櫃檯的人在, 否則鏡頭拍攝到的後面要是還有其他商品, 那QR碼根本沒有被拍出來, 所以結不到帳

需登入才能回答問題