(圖片來源:圖蟲創(chuàng)意)
事實(shí)證明,在許多領(lǐng)域,數(shù)據(jù)科學(xué)(Data Science)是企業(yè)的最佳盟友。但你知道數(shù)據(jù)科學(xué)是如何工作的嗎?
我們采訪了Eurora的數(shù)據(jù)科學(xué)家Simo Jaanus。他解釋了什么是數(shù)據(jù)科學(xué),數(shù)據(jù)科學(xué)家會(huì)面臨哪些挑戰(zhàn),以及Eurora如何利用數(shù)據(jù)科學(xué)來提供更可靠的服務(wù)。
“鑒于今天產(chǎn)生的巨大數(shù)據(jù)量,數(shù)據(jù)科學(xué)是許多行業(yè)的重要組成部分,如跨境合規(guī)。”——Simo Jaanus, Eurora數(shù)據(jù)科學(xué)家
跨境合規(guī)是Eurora使用數(shù)據(jù)科學(xué)將合規(guī)性提高到新水平的領(lǐng)域。數(shù)百名專家、科學(xué)家、分析師和研究人員開發(fā)了跨境貿(mào)易合規(guī)方面的機(jī)器學(xué)習(xí)。
(圖片來源:Eurora)
Simo是Eurora數(shù)據(jù)科學(xué)團(tuán)隊(duì)的一員,他是數(shù)據(jù)科學(xué)家和機(jī)器學(xué)習(xí)工程師。
他畢業(yè)于塔爾圖大學(xué),這是世界排名前1.2%的大學(xué)之一。在那里,他獲得了軟件工程的碩士學(xué)位。Simo在成功通過他的碩士論文 《為產(chǎn)品圖像的HS編碼預(yù)測建立分類模型 》后獲得了學(xué)位。
他的研究工作將有助于改進(jìn)Eurora的人工智能引擎,該引擎是由我們的專家建立的。
以下是他與我們分享的內(nèi)容。
1、什么是數(shù)據(jù)科學(xué)(Data Science)?
數(shù)據(jù)科學(xué)是一個(gè)研究領(lǐng)域,它結(jié)合了領(lǐng)域?qū)I(yè)知識(shí)、編程技能以及對數(shù)學(xué)和統(tǒng)計(jì)學(xué)的理解。其目的是從數(shù)據(jù)中提取有意義的洞察力。
數(shù)據(jù)科學(xué)家在各種數(shù)據(jù)類型上使用機(jī)器學(xué)習(xí)(ML)算法:數(shù)字、文本、照片、視頻和音頻。他們從中創(chuàng)造出人工智能(AI)系統(tǒng),可以進(jìn)行通常需要人類智慧的活動(dòng)。
這些系統(tǒng)產(chǎn)生的見解,分析師和商業(yè)用戶可以轉(zhuǎn)化為實(shí)際的商業(yè)價(jià)值。
“鑒于今天產(chǎn)生的巨大數(shù)據(jù)量,數(shù)據(jù)科學(xué)是許多部門的一個(gè)重要組成部分,如跨境合規(guī)。”Simo說道。
數(shù)據(jù)科學(xué)家每天都在處理許多問題:我們應(yīng)該如何使用這些信息?我們?nèi)绾卫盟鼇戆l(fā)揮我們的優(yōu)勢?我們能從中找到什么實(shí)際用途?
自從數(shù)據(jù)科學(xué)變得越來越流行以來,企業(yè)已經(jīng)開始使用它,這樣他們可以擴(kuò)大他們的業(yè)務(wù),提高消費(fèi)者的滿意度。在跨境合規(guī)領(lǐng)域,Eurora使用了數(shù)據(jù)科學(xué),這是解決該方案的核心。
2、Eurora為什么要使用數(shù)據(jù)科學(xué)?
Eurora使用數(shù)據(jù)科學(xué)來自動(dòng)分配HS編碼。我們使用AI(人工智能)分配HS編碼,以基于文本的產(chǎn)品描述作為輸入數(shù)據(jù)。
協(xié)調(diào)制度(HS)是一個(gè)國際編碼系統(tǒng),用于對貿(mào)易商品進(jìn)行分類。它是跨境貿(mào)易的支柱,因?yàn)樗缓jP(guān)當(dāng)局用來識(shí)別產(chǎn)品和評估適用的稅收。鑒于HS編碼的重要性,在分配這些編碼時(shí),是沒有模糊分配或者錯(cuò)誤分配的空間的。
這就是為什么在貿(mào)易合規(guī)中使用數(shù)據(jù)科學(xué)會(huì)更加安全。Eurora的數(shù)據(jù)科學(xué)主管Kristi Helekivi在之前的采訪中解釋了為什么使用AI來分配HS編碼是最可靠的方式。
人工分配很容易出錯(cuò),一個(gè)人不可能熟記整個(gè)HS命名法,該命名法大約有5300個(gè)HS編碼。通過使用機(jī)器,可以獲得準(zhǔn)確的數(shù)據(jù),也可以處理更大量的數(shù)量。
“一臺(tái)機(jī)器比一個(gè)人的知識(shí)儲(chǔ)備更廣闊。有了人工智能,所有來自不同人的知識(shí)都能被一臺(tái)機(jī)器學(xué)習(xí)并吸收。”Simo補(bǔ)充說道。
如果企業(yè)知道如何使用數(shù)據(jù),他們可以從數(shù)據(jù)中獲益良多。數(shù)據(jù)科學(xué)家的任務(wù)之一正是在業(yè)務(wù)方面也發(fā)現(xiàn)和引入可能性。數(shù)據(jù)科學(xué)還幫助Eurora從競爭對手中脫穎而出,因?yàn)樗构灸軌蚋鲜袌鲂枨螅o客戶提供他們想要的服務(wù)。
數(shù)據(jù)科學(xué)將領(lǐng)域知識(shí)、編程技能和數(shù)學(xué)結(jié)合起來,以減少人工勞動(dòng)。——Simo Jaanus
3、數(shù)據(jù)科學(xué)在合規(guī)領(lǐng)域的挑戰(zhàn)是什么?
盡管使用數(shù)據(jù)科學(xué)在監(jiān)管合規(guī)方面是一筆真正的財(cái)富,但它也有它的難處。
Simo和我們詳細(xì)解釋道:“當(dāng)你開始一個(gè)數(shù)據(jù)科學(xué)項(xiàng)目時(shí),第一步就是要找到所需要的數(shù)據(jù)來開始工作。因此,數(shù)據(jù)科學(xué)家從一開始就可能面臨挑戰(zhàn)。”
當(dāng)Eurora開始開發(fā)其引擎時(shí),并沒有那么多可用于電子商務(wù)的有效數(shù)據(jù)。盡管如此,Eurora還是設(shè)法收集了高質(zhì)量的數(shù)據(jù)。“我們建立了一個(gè)團(tuán)隊(duì)和系統(tǒng),能夠快速有效地驗(yàn)證新的數(shù)據(jù)。”
數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)正在迅速發(fā)展。每個(gè)月都會(huì)有新的發(fā)現(xiàn)和解決方案待解鎖。因此,跟上這些發(fā)展很耗時(shí),圍繞它們建立可用的系統(tǒng)架構(gòu)也需要時(shí)間。
正如Simo所解釋的,除了每天會(huì)有大量的新發(fā)現(xiàn),需要及時(shí)提供解決各種解決問題的策略也會(huì)讓人不知所措。
找到正確的行動(dòng)路線和解決方案需要大量的知識(shí)、時(shí)間和實(shí)驗(yàn)。——Simo Jaanus
由于Eurora是該領(lǐng)域的先驅(qū),數(shù)據(jù)科學(xué)團(tuán)隊(duì)還面臨著其他關(guān)于關(guān)鍵績效指標(biāo)和衡量標(biāo)準(zhǔn)的挑戰(zhàn)。“我們?nèi)栽趯ふ乙粋€(gè)有效、簡單和易懂的追蹤進(jìn)展的最佳方式,因?yàn)槲覀冋诮⒁粋€(gè)之前從未自動(dòng)完成的東西。”
4、Eurora如何克服數(shù)據(jù)科學(xué)的挑戰(zhàn)?
正如Simo所解釋的,使用人工智能分配HS編碼是提供準(zhǔn)確結(jié)果的最可靠方式。盡管如此,它仍可能面臨挑戰(zhàn),因?yàn)樗蕾囉诳蛻籼峁┑妮斎???蛻粜枰蛞嫣峁?zhǔn)確的產(chǎn)品描述,以便它能夠確定正確的HS編碼。為了避免引擎因?yàn)槊枋霾煌暾鵁o法分配HS編碼的情況,數(shù)據(jù)科學(xué)團(tuán)隊(duì)進(jìn)行深度研究,并正在實(shí)施一個(gè)根本原因的檢測機(jī)制。
“我們的機(jī)器正在自動(dòng)檢測根本原因,即時(shí)指出是否有任何必要的信息沒有正確填寫,這樣客戶就可以立即調(diào)整他們的產(chǎn)品描述。該團(tuán)隊(duì)已經(jīng)對描述實(shí)施了產(chǎn)品、材料和細(xì)節(jié)檢測。從這些結(jié)果中,我們可以確定產(chǎn)品、材料或細(xì)節(jié)對于最終的根本原因預(yù)測是否是必要的,或者HS編碼是否可以在沒有它的情況下進(jìn)行分配。由于我們剛剛實(shí)現(xiàn)了這一功能,目前我們?nèi)栽趦?nèi)部評估結(jié)果,并只在付費(fèi)客戶要求時(shí)提供反饋。近期的目標(biāo)是及時(shí)確定根本原因,甚至建議可以利用更多的描述詞來正確分配HS編碼。”
此外,該團(tuán)隊(duì)目前正在調(diào)查新的數(shù)據(jù)輸入類型以分配HS編碼。他們發(fā)現(xiàn),基于圖像的數(shù)據(jù)可能是一種非常有資源的方法,這一點(diǎn)被Simo的研究工作所證實(shí)。Simo的碩士論文名為 《從產(chǎn)品圖像中建立HS編碼預(yù)測的分類模型》。他的研究工作的目的是發(fā)現(xiàn)從圖像中預(yù)測HS編碼的最有效方法。
他發(fā)現(xiàn)了非常有希望的結(jié)果。“通過圖片,我們不需要細(xì)節(jié)來分配HS編碼,因?yàn)榇蟛糠值男畔⒍际欠浅V庇^的。為了找到最佳的解決方案,我在論文中試驗(yàn)了各種機(jī)器學(xué)習(xí)的人工神經(jīng)網(wǎng)絡(luò),將準(zhǔn)確性和推理速度考慮在內(nèi)。表現(xiàn)最好的模型能夠產(chǎn)生與人類專家非常相似的結(jié)論,甚至超過了三個(gè)模型中的兩個(gè)。”
即使這些結(jié)果是有希望的,該團(tuán)隊(duì)仍在不斷進(jìn)行應(yīng)用研究,調(diào)研在商業(yè)中實(shí)施其發(fā)現(xiàn)。
從長遠(yuǎn)來看,這也為使用基于文本的產(chǎn)品描述和圖像給出最準(zhǔn)確的預(yù)測鋪平了道路。——Simo Jaanus
5、Eurora計(jì)劃在未來如何進(jìn)一步發(fā)展數(shù)據(jù)科學(xué)?
數(shù)據(jù)科學(xué)團(tuán)隊(duì)將繼續(xù)研究模型。他們計(jì)劃嘗試使用嵌入式模型或更強(qiáng)大、更快速的模型。計(jì)算機(jī)視覺是不斷發(fā)展的,新的模型也經(jīng)常被建議。
“作為一名數(shù)據(jù)科學(xué)家,要接觸創(chuàng)新和研究。我們有很多有趣的想法來改進(jìn)Eurora的AI引擎。每天都有新客戶來使用我們的服務(wù),所以我們可以收集更多有用的數(shù)據(jù)和反饋來改進(jìn)系統(tǒng)?!?/span>Simo和我們分享道。
除了HS編碼分配,該團(tuán)隊(duì)計(jì)劃使用數(shù)據(jù)科學(xué)來改善Eurora在其他領(lǐng)域的活動(dòng)。這可能包括使用數(shù)據(jù)科學(xué)來改善Eurora的網(wǎng)頁和用戶體驗(yàn),甚至是翻譯和語言檢測。
如果一切按計(jì)劃進(jìn)行,將有數(shù)十億行的數(shù)據(jù)可供我們分析和訓(xùn)練模型。——Simo Jaanus
Simo堅(jiān)信,數(shù)據(jù)科學(xué)將幫助Eurora實(shí)現(xiàn)極高的目標(biāo)。
我堅(jiān)信我們在Eurora所做的事情,并理解這是一件意義重大的事情。因此,已經(jīng)有跡象表明,Eurora可能會(huì)成為下一個(gè)獨(dú)角獸、十角獸,或者是百角獸。我希望數(shù)據(jù)科學(xué)能夠協(xié)助企業(yè)朝著這個(gè)方向發(fā)展!——Simo Jaanus
數(shù)據(jù)科學(xué)不僅有助于HS編碼分配過程,也有助于關(guān)稅和稅收計(jì)算、IOSS、限制篩選和清關(guān)服務(wù)。你愿意用安全的基于人工智能的解決方案讓你的合規(guī)流程自動(dòng)化嗎?Eurora就在這里,隨時(shí)為你提供有效的解決方案!
想要了解Eurora如何助力您的跨境業(yè)務(wù),敬請聯(lián)系sales.cn@eurora.com
Eurora是一家可以提供跨境貿(mào)易全鏈解決方案的基于人工智能和機(jī)器學(xué)習(xí)的科技公司。Eurora不同的組合服務(wù),包括IOSS解決方案、OSS&VAT注冊服務(wù)、HS編碼適配服務(wù)、關(guān)稅及稅金計(jì)算服務(wù)、限制方&違禁品篩查及歐盟在線化清關(guān)方案,可以幫您實(shí)現(xiàn)報(bào)稅自動(dòng)化和清關(guān)自動(dòng)化,從而幫您節(jié)約時(shí)間成本和人工成本。
(編輯:江同)
(來源:Eurora)
以上內(nèi)容僅代表作者本人觀點(diǎn),不代表雨果跨境立場!如有關(guān)于作品內(nèi)容、版權(quán)或其它問題請于作品發(fā)表后的30日內(nèi)與雨果跨境取得聯(lián)系。