題目敘述
(1) 題目背景與重要性:
工程師需要從文件的表格中提取相關資訊,但表格位置與變化太多元幾乎無法有明確收斂條件,預開發表格偵測工具從文件中找到表格的位置。
(2) 問題情境與痛點(Paint Point):
工程師需要從表格上取得資訊,但複製表格時常常遇到加密或上鎖的情形,在此狀況下便需要逐字慢慢打,大量的打字工作將造成工程師工作負擔
(3) 預期透過AI達到的目的與利益點(Gain):
期望可以透過AI的方式將偵測到表格在文件中的位置,並轉換為圖片的形式供後續處理,減少工程師找表格以及分析表格的負擔
(4) 技術完成後的使用對象:
公司內部所有需要閱讀文件的工程師
(5) 成果運用方式:
因表格轉換成圖片形式,因此可利用影像處理的演算法處理,最後可以直接將pdf文件上的表格直接轉換為指定格式的可編輯文件
資料型態
公開的規格書文件 pdf檔
資料集整備度與細節說明
1. 未整理需特殊處理或協助標籤
2. 可提供45000份pdf檔案,約35G
3. 需注意檔案是否可正常開啟 (部份有損毀情形)
4. 損毀檔案請捨棄不使用
期望成果需求
1. 競賽期間
.完成表格偵測演算法
.IOU 0.5 的狀況下,Accuracy 超過80%
.自動擷取偵測到的表格,並轉換成圖片
2. 服務上線後
.IOU 0.5 的狀況下,Accuracy 超過90%
可提供之解題資源
負責窗口一人
額外獎勵誘因
無
出題單位
富比庫股份有限公司
單位(公司)簡介
AI時代正劇烈地改變世界!富比庫已準備好迎接充滿希望與挑戰的神祕AI世界。富比庫股份有限公司(footprintku Inc.)於2015年05月成立,是一個充滿活力、創造力與無懼挑戰,且擁有跨電子產業與資訊產業的創新技術研發團隊。全球第一個以AI技術為核心將電子零件資料數位化,研發多項EDA Library創新技術,提供使用者前所未有的體驗與享受新技術所帶來的價值與便利。
結合AI技術數位化電子零件資料,研發EDA Library自動建置與驗證引擎,於雲端服務平台Footprintku.com,提供最新與最即時的技術服務與隨取即用的共享資源。發展具學習能力的服務型機器人成為EDA Library領域AI應用的先驅,為產業注入新元素與加速創新,開啟電子產業的新視界。
其他備註
無