圖片來源:廣州日報
人工智能是引領(lǐng)未來的戰(zhàn)略性通用技術(shù)和驅(qū)動新一輪產(chǎn)業(yè)變革的新引擎,對于搶占未來發(fā)展制高點、構(gòu)建現(xiàn)代化產(chǎn)業(yè)體系至關(guān)重要。
在人工智能的神奇世界里,有一群特殊的藝術(shù)家,他們用數(shù)據(jù)作為畫筆,繪制出AI“理解世界”的藍圖。他們就是AI訓練師,通過“投喂”海量數(shù)據(jù)并不斷進行模型的訓練迭代,讓AI更好地“理解”人類,為發(fā)展新質(zhì)生產(chǎn)力提供強大驅(qū)動力。
AI訓練師:我要讓AI更“懂”人類
文/廣州日報全媒體記者文靜、張露 圖/廣州日報全媒體記者文靜、張露 實習生朱曉燕(除署名外)
我是冼鴻東,作為杰創(chuàng)智能科技股份有限公司的一名AI訓練師,我有幸成為這場技術(shù)變革的見證者和參與者。AI領(lǐng)域的技術(shù)更新迭代非??欤@使得AI訓練師需要具備較高的專業(yè)門檻,并且需要不斷儲備跨學科的知識。
自2020年加入公司以來,我參與了多個與人工智能相關(guān)的項目和研究課題,主要負責人臉識別產(chǎn)品的研發(fā),見證了人工智能從技術(shù)研發(fā)走向行業(yè)應(yīng)用的全過程。
在AI訓練領(lǐng)域,我們的任務(wù)主要分為兩大類:基礎(chǔ)數(shù)據(jù)的準備和模型的訓練迭代。數(shù)據(jù)標注是模型訓練的基石,而模型的訓練迭代則是不斷優(yōu)化算法、提升模型性能的過程,使其變得更“聰明”。
杰創(chuàng)智能AI訓練師冼鴻東
以安全帽正確佩戴智能識別為例,我們團隊收集了數(shù)萬張正負樣本圖片。這通常是一項龐大的工作。我們不僅要標注出安全帽本身,還要標注出佩戴者的姿勢,以確保模型能夠準確識別出安全帽是否正確佩戴。標注完成后,我們便著手進行算法的開發(fā)和大模型的訓練,這是一個不斷調(diào)試和優(yōu)化的過程。當然,隨著模型的不斷迭代,我們也在不斷地簡化和智能化標注過程。例如,一個初始準確率只有60%~70%的模型,可以通過智能標注的方式,反過來調(diào)整標注,從而提高準確率,減輕人工標注的負擔。
建立模型并不是最難的部分,真正的挑戰(zhàn)在于調(diào)試和優(yōu)化,以找到最優(yōu)的模型效果。這個過程可能會非常耗時,需要不斷地迭代和迸發(fā)靈感。我們雖是技術(shù)開發(fā)者,但要不斷學習安全生產(chǎn)的法律法規(guī)、安全規(guī)范,與央企、監(jiān)理單位等有著資深實踐經(jīng)驗的管理人員探討,不斷鍛造大模型的識別能力,提高AI識別的準確性,不斷迭代優(yōu)化安全管控平臺的功能模塊。
我把自己的工作比喻為升級打怪,不斷克服挑戰(zhàn),提升技能。雖然工作過程可能漫長,但當看到我們訓練出的模型在實際產(chǎn)品中發(fā)揮作用時,我感到非常有成就感。我們通過數(shù)據(jù)標注和模型訓練,讓AI越來越智能,越來越接近人類的識別和判斷能力。