跳到主要內容
 
:::

Challenge Details

題目敘述
(1) 題目背景與重要性: 工程師需要從文件的表格中提取相關資訊,但表格位置與變化太多元幾乎無法有明確收斂條件,預開發表格偵測工具從文件中找到表格的位置。 (2) 問題情境與痛點(Paint Point): 工程師需要從表格上取得資訊,但複製表格時常常遇到加密或上鎖的情形,在此狀況下便需要逐字慢慢打,大量的打字工作將造成工程師工作負擔 (3) 預期透過AI達到的目的與利益點(Gain): 期望可以透過AI的方式將偵測到表格在文件中的位置,並轉換為圖片的形式供後續處理,減少工程師找表格以及分析表格的負擔 (4) 技術完成後的使用對象: 公司內部所有需要閱讀文件的工程師 (5) 成果運用方式: 因表格轉換成圖片形式,因此可利用影像處理的演算法處理,最後可以直接將pdf文件上的表格直接轉換為指定格式的可編輯文件


資料型態
公開的規格書文件 pdf檔


資料集整備度與細節說明
1. 未整理需特殊處理或協助標籤 2. 可提供45000份pdf檔案,約35G 3. 需注意檔案是否可正常開啟 (部份有損毀情形) 4. 損毀檔案請捨棄不使用


期望成果需求
1. 競賽期間 .完成表格偵測演算法 .IOU 0.5 的狀況下,Accuracy 超過80% .自動擷取偵測到的表格,並轉換成圖片 2. 服務上線後 .IOU 0.5 的狀況下,Accuracy 超過90%


可提供之解題資源
負責窗口一人


額外獎勵誘因


出題單位
富比庫股份有限公司


單位(公司)簡介
AI時代正劇烈地改變世界!富比庫已準備好迎接充滿希望與挑戰的神祕AI世界。富比庫股份有限公司(footprintku Inc.)於2015年05月成立,是一個充滿活力、創造力與無懼挑戰,且擁有跨電子產業與資訊產業的創新技術研發團隊。全球第一個以AI技術為核心將電子零件資料數位化,研發多項EDA Library創新技術,提供使用者前所未有的體驗與享受新技術所帶來的價值與便利。 結合AI技術數位化電子零件資料,研發EDA Library自動建置與驗證引擎,於雲端服務平台Footprintku.com,提供最新與最即時的技術服務與隨取即用的共享資源。發展具學習能力的服務型機器人成為EDA Library領域AI應用的先驅,為產業注入新元素與加速創新,開啟電子產業的新視界。


其他備註


* 題目因實際數據改變或其他不可抗力之事由,出題企業保有修改、變更或取消題目之權利。

相關競賽
運用AI技術將線材2D CAD圖轉擬真照片
有鑑於產品2D示意圖並不能完全展示細節,往往都要再另行拍照或製樣提供給客戶確認,往返耗時。期透過AI將 2D CAD Dxf圖面轉為照片或3D CAD圖檔與照片
透過AI進行設計圖或影像檔案的色彩結構分析,並提供分色系統的使用建議
目前開發的傳統網版印花的半色調分色智慧系統,共有四色、六色、八色、九色和十色的分色系統,但設計圖該使用幾色的分色系統,目前是由人工經驗進行判斷。
陶瓷珠表面瑕疵與紋理識別
使用陶瓷珠瑕疵紋理之照片進行瑕疵識別分類,每秒約40張照片辨識速度,辨識率98%以上,並辨識出<10um之傷痕。
文件格式解析在規格書文件上的表格偵測AI解決方案
文件的構成要件包含文字、表格、圖片等資料,而表格的變化形態最多元,常常會在文件中的任何位置出現,因此在進行分析時常常會無法正確找到表格的位置,因此如何從文件的結構中正確把表格的區域找出來將是一個具挑戰性的目標
設計圖尺寸參數擷取方法
設計圖的構成經常包含各種方向的視角,因此對於一項產品的設計也會因為視角的不同出現不同的尺寸標示方式。實際製作產品時需要由工程師從設計圖中找到參數並正確執行的過程會經常出錯,因此需要透過一個智慧化的系統將參數從設計圖中取出