翻譯行業(yè)巨變:TowerLLM 憑什么超越 Google 翻譯?
前段時(shí)間,全球領(lǐng)先的語言服務(wù)與人工智能解決方案提供商 TransPerfect 正式宣布,已完成對(duì)葡萄牙人工智能企業(yè) Unbabel 的收購(gòu)。Unbabel 是機(jī)器翻譯技術(shù)領(lǐng)域的重要?jiǎng)?chuàng)新者,尤其以其自研的翻譯專用大語言模型和質(zhì)量評(píng)估系統(tǒng)在行業(yè)內(nèi)廣受認(rèn)可。
目前雙方未披露本次交易的具體金額。
Unbabel 成立于 2013 年,總部位于里斯本,早年曾入選知名創(chuàng)業(yè)加速器 Y Combinator,該機(jī)構(gòu)也曾培育出 Airbnb、Stripe 等成功企業(yè)。
Unbabel 憑借其核心產(chǎn)品 TowerLLM ——首個(gè)專為翻譯設(shè)計(jì)的大語言模型,以及 COMET ——目前已成為機(jī)器翻譯質(zhì)量評(píng)估的行業(yè)標(biāo)準(zhǔn)工具,建立了顯著的技術(shù)優(yōu)勢(shì)和品牌聲譽(yù)。
TransPerfect 的總裁兼聯(lián)合首席執(zhí)行官 Phil Shawe 表示:“Unbabel 在翻譯專用人工智能模型的開發(fā)方面走在了前列。我們將雙方的技術(shù)整合視為對(duì)現(xiàn)有客戶的一大助力,未來我們將持續(xù)推動(dòng)效率提升與產(chǎn)品創(chuàng)新?!?/p>
本次收購(gòu)?fù)瓿珊?,Unbabel 的翻譯技術(shù)將被集成至 TransPerfect 的全球化管理平臺(tái) GlobalLink 中,共同構(gòu)建一個(gè)覆蓋人工智能模型研發(fā)、翻譯質(zhì)量評(píng)估與企業(yè)級(jí)多語言解決方案分發(fā)的綜合服務(wù)體系。
Unbabel 的聯(lián)合創(chuàng)始人兼首席執(zhí)行官 Vasco Pedro 將繼續(xù)留任,負(fù)責(zé)領(lǐng)導(dǎo)技術(shù)整合與團(tuán)隊(duì)融合。
1. 降維打擊的技術(shù)
在技術(shù)范式的層面,此次收購(gòu)的核心意義在于體現(xiàn)了從“通用大模型”到“垂直精專”的路徑轉(zhuǎn)變。
Unbabel 的真正價(jià)值并不在于它使用了人工智能這一熱門技術(shù),而在于其長(zhǎng)期積累的專有語言數(shù)據(jù)和針對(duì)特定領(lǐng)域優(yōu)化的算法系統(tǒng)所共同構(gòu)筑的競(jìng)爭(zhēng)壁壘。
與 OpenAI 的 GPT-4o、Google 翻譯等通用大模型不同,Unbabel 開發(fā)的 TowerLLM 是專門為翻譯任務(wù)設(shè)計(jì)的大語言模型。
它尤其專注于法律、醫(yī)療、市場(chǎng)營(yíng)銷等對(duì)語言準(zhǔn)確性要求極高的領(lǐng)域,在這些場(chǎng)景中,一個(gè)術(shù)語的誤譯、一個(gè)語句的文化誤讀都可能帶來嚴(yán)重的后果。例如醫(yī)療文檔的翻譯錯(cuò)誤可能直接影響患者治療,法律條款的表述偏差可能引發(fā)合同糾紛或合規(guī)風(fēng)險(xiǎn),而品牌營(yíng)銷文案的拙劣本地化則會(huì)導(dǎo)致企業(yè)聲譽(yù)受損和市場(chǎng)進(jìn)入失敗。
TowerLLM 之所以能夠在這些專業(yè)領(lǐng)域表現(xiàn)出更高的質(zhì)量,是因?yàn)樗鼜募軜?gòu)設(shè)計(jì)之初就專注于語言精確性和文化適應(yīng)力,而不是追求多任務(wù)的對(duì)話能力。
它建立在大量專業(yè)領(lǐng)域的高質(zhì)量雙語數(shù)據(jù)基礎(chǔ)上進(jìn)行訓(xùn)練,這些數(shù)據(jù)多為企業(yè)級(jí)用戶在實(shí)際業(yè)務(wù)中產(chǎn)生的真實(shí)語料,包含豐富的行業(yè)術(shù)語和上下文語境。
這使得該模型輸出的翻譯結(jié)果不僅語句通順,更重要的是能夠符合特定行業(yè)的表達(dá)規(guī)范和文化習(xí)慣。
另一方面,Unbabel 開發(fā)的 COMET 系統(tǒng)已成為機(jī)器翻譯質(zhì)量評(píng)估的行業(yè)標(biāo)準(zhǔn)工具。它的作用在于能夠自動(dòng)、客觀地衡量不同翻譯結(jié)果的準(zhǔn)確度和可用性,這改變了傳統(tǒng)上依賴人工抽樣評(píng)估的主觀性和滯后性。
COMET 的廣泛采用使其不僅僅是一個(gè)技術(shù)工具,更成為一種行業(yè)基準(zhǔn)。
TransPerfect 通過整合這一系統(tǒng),將有能力為翻譯服務(wù)提供可量化、可驗(yàn)證的質(zhì)量認(rèn)證,從而在市場(chǎng)中建立類似“質(zhì)量認(rèn)證”的話語權(quán)。這種能力對(duì)于企業(yè)客戶極具吸引力——尤其是在那些對(duì)錯(cuò)誤零容忍的行業(yè),他們不僅需要翻譯服務(wù),更需要確信翻譯結(jié)果不會(huì)帶來業(yè)務(wù)風(fēng)險(xiǎn)。
從整體來看,Unbabel 帶來的技術(shù)資產(chǎn)與 TransPerfect 現(xiàn)有的全球語言服務(wù)網(wǎng)絡(luò)結(jié)合,形成了一個(gè)從數(shù)據(jù)獲取、模型訓(xùn)練、質(zhì)量評(píng)估到產(chǎn)品分發(fā)的完整閉環(huán)。
這一系統(tǒng)能夠不斷利用客戶反饋和后期編輯的數(shù)據(jù)優(yōu)化模型,同時(shí)通過可靠的質(zhì)量控制增強(qiáng)客戶信任,從而構(gòu)建出難以被簡(jiǎn)單復(fù)制的技術(shù)護(hù)城河。
2. 商業(yè)模式的轉(zhuǎn)變
在商業(yè)模式層面,此次收購(gòu)標(biāo)志著語言服務(wù)行業(yè)正經(jīng)歷一場(chǎng)從“成本競(jìng)爭(zhēng)”轉(zhuǎn)向“價(jià)值定價(jià)”的根本性變革。
傳統(tǒng)翻譯市場(chǎng)長(zhǎng)期以來處于高度同質(zhì)化的競(jìng)爭(zhēng)狀態(tài),服務(wù)提供商大多以字?jǐn)?shù)為單位進(jìn)行計(jì)價(jià),客戶也習(xí)慣于將翻譯視為一項(xiàng)需要盡量壓縮成本的基礎(chǔ)性開支。
這種模式導(dǎo)致行業(yè)陷入價(jià)格戰(zhàn)的紅海,難以體現(xiàn)專業(yè)翻譯的真實(shí)價(jià)值,同時(shí)也無法有效保證翻譯結(jié)果的質(zhì)量穩(wěn)定性,尤其在高風(fēng)險(xiǎn)領(lǐng)域,如法律、醫(yī)療或市場(chǎng)營(yíng)銷,低質(zhì)量翻譯可能導(dǎo)致嚴(yán)重的業(yè)務(wù)風(fēng)險(xiǎn)或合規(guī)問題。
TransPerfect 與 Unbabel 的結(jié)合從根本上改變了這一邏輯。
通過整合 Unbabel 的 COMET 質(zhì)量評(píng)估系統(tǒng),翻譯質(zhì)量不再依賴于主觀判斷,而是可以通過客觀、可量化的指標(biāo)(如 COMET 分?jǐn)?shù))進(jìn)行評(píng)估和承諾。這使得企業(yè)客戶能夠?yàn)槠渌枰姆g質(zhì)量等級(jí)支付相應(yīng)費(fèi)用,而不再僅僅為文字?jǐn)?shù)量買單。例如,客戶可以要求達(dá)到特定的質(zhì)量分?jǐn)?shù)(如 98%),并為此支付更高價(jià)格,同時(shí)獲得質(zhì)量保障。這種模式類似于云計(jì)算行業(yè)中廣泛采用的服務(wù)水平協(xié)議(SLA),客戶購(gòu)買的不再是底層資源,而是可靠的服務(wù)結(jié)果。
另一方面,TransPerfect 已經(jīng)通過其 GlobalLink 平臺(tái)為大量跨國(guó)企業(yè)提供內(nèi)容管理和多語言工作流服務(wù)。加入 Unbabel 的技術(shù)能力后,TransPerfect 能夠提供“機(jī)器翻譯 + 人工后期編輯”的混合型解決方案,在提升效率的同時(shí)保障質(zhì)量。
而且這一模式形成了可持續(xù)優(yōu)化的數(shù)據(jù)閉環(huán):客戶使用服務(wù)過程中產(chǎn)生的反饋和后期編輯數(shù)據(jù),可以用于持續(xù)訓(xùn)練和優(yōu)化 TowerLLM 模型,從而不斷提高翻譯準(zhǔn)確性和專業(yè)性。隨著更多客戶的使用,系統(tǒng)不斷迭代改進(jìn),建立起越來越強(qiáng)的數(shù)據(jù)網(wǎng)絡(luò)效應(yīng)。
其關(guān)鍵核心在于將企業(yè)客戶對(duì)翻譯服務(wù)的認(rèn)知從“可削減的成本”轉(zhuǎn)變?yōu)椤翱晒芾淼娘L(fēng)險(xiǎn)”。
在全球化業(yè)務(wù)中,翻譯錯(cuò)誤可能導(dǎo)致法律糾紛、品牌損害或市場(chǎng)進(jìn)入失敗,而這些風(fēng)險(xiǎn)的成本遠(yuǎn)高于支付高質(zhì)量翻譯服務(wù)的費(fèi)用。
因此,企業(yè)更愿意為能夠量化、保障結(jié)果的服務(wù)支付溢價(jià),從而也推動(dòng)了整個(gè)語言服務(wù)行業(yè)利潤(rùn)模式的升級(jí)。從長(zhǎng)遠(yuǎn)來看,這種以質(zhì)量為核心、結(jié)果可承諾的定價(jià)方式,不僅提升了TransPerfect的競(jìng)爭(zhēng)力,也為行業(yè)建立了新的價(jià)值標(biāo)準(zhǔn)。
3. 加速集中的行業(yè)格局
語言服務(wù)市場(chǎng)目前規(guī)模已達(dá)到數(shù)百億美元,但長(zhǎng)期處于高度分散的狀態(tài),由大量中小型翻譯公司和服務(wù)商共同參與。
自人工智能技術(shù)的成熟以來,很明顯已經(jīng)開始推動(dòng)這個(gè)行業(yè)快速整合。這一過程中,市場(chǎng)正逐漸形成三類主要參與者:
第一類是像 TransPerfect 與 Unbabel 這樣通過并購(gòu)形成的垂直整合平臺(tái),它們具備從技術(shù)開發(fā)、質(zhì)量評(píng)估到客戶服務(wù)的完整能力,核心優(yōu)勢(shì)在于能夠提供可量化、高質(zhì)量的服務(wù),尤其受到對(duì)翻譯準(zhǔn)確性要求極高的大型企業(yè)客戶的青睞。
第二類是科技巨頭提供的通用翻譯工具,例如 Google Translate 和 DeepL,它們依托廣泛的用戶基礎(chǔ)和強(qiáng)大的模型研發(fā)能力,以免費(fèi)或低成本策略占據(jù)大眾市場(chǎng),但在專業(yè)性要求較強(qiáng)的領(lǐng)域如法律、醫(yī)療或金融等,其輸出的可靠性和精確度仍存在不足。
第三類則是聚焦于特定小語種或某些冷門細(xì)分市場(chǎng)的小型服務(wù)商,它們憑借靈活性和針對(duì)性服務(wù)在局部市場(chǎng)保持活力。
這種結(jié)構(gòu)性的轉(zhuǎn)變也影響了資本流向和投資邏輯,投資者越來越看重那些同時(shí)掌握專有數(shù)據(jù)、先進(jìn)算法和廣泛客戶渠道的公司,而非僅依靠人力資源規(guī)模的傳統(tǒng)語言服務(wù)商。
可以預(yù)見,未來的并購(gòu)活動(dòng)可能會(huì)進(jìn)一步指向那些在軟件本地化、開發(fā)者工具等細(xì)分領(lǐng)域擁有技術(shù)優(yōu)勢(shì)的企業(yè),例如 Lokalise 或 Crowdin 等平臺(tái),因?yàn)樗鼈兡軌驇椭召?gòu)方快速進(jìn)入新的客戶群體和應(yīng)用場(chǎng)景。
行業(yè)很可能在五年內(nèi)呈現(xiàn)出類似云計(jì)算市場(chǎng)的寡頭格局,即少數(shù)幾家綜合平臺(tái)占據(jù)大部分市場(chǎng)份額,其余則由大量小型利基企業(yè)填補(bǔ)特殊需求。
不過,在這一發(fā)展過程中,該行業(yè)也仍然面臨多方面的風(fēng)險(xiǎn)和挑戰(zhàn)。
技術(shù)上,專業(yè)翻譯模型雖在特定領(lǐng)域表現(xiàn)優(yōu)異,但通用大模型仍在不斷迭代。例如,未來像 GPT-5 這樣的模型如果在專業(yè)翻譯能力上取得突破,可能會(huì)削弱目前垂直解決方案的技術(shù)優(yōu)勢(shì)。
監(jiān)管商,尤其是在歐洲,人工智能應(yīng)用正受到越來越嚴(yán)格的審查。Unbabel 的 COMET 系統(tǒng)作為自動(dòng)化質(zhì)量評(píng)估工具,如果被用于合同履行或合規(guī)性判斷等場(chǎng)景,可能會(huì)落入歐盟《人工智能法案》中“高風(fēng)險(xiǎn)系統(tǒng)”的監(jiān)管范疇,從而面臨額外的合規(guī)要求和審查程序。
而在轉(zhuǎn)型過程中,勞動(dòng)力結(jié)構(gòu)調(diào)整也是一個(gè)非常現(xiàn)實(shí)的問題,許多傳統(tǒng)翻譯人員的工作內(nèi)容正逐漸從直接翻譯轉(zhuǎn)向?qū)C(jī)器輸出結(jié)果的后期編輯、質(zhì)量審核以及模型訓(xùn)練。
這一轉(zhuǎn)變要求從業(yè)人員具備新的技術(shù)理解和操作能力,但目前人才培養(yǎng)和技能更新的速度尚未完全跟上行業(yè)需求,短期內(nèi)可能出現(xiàn)一定程度的結(jié)構(gòu)性失業(yè)或技能錯(cuò)配。
如何有效協(xié)同人類專業(yè)知識(shí)與人工智能效率,平衡技術(shù)創(chuàng)新與社會(huì)影響,將成為行業(yè)下一步發(fā)展的關(guān)鍵課題。
4. 最后的啟示
就中國(guó)而言,在技術(shù)路徑選擇上,中國(guó)的翻譯服務(wù)提供商和科技公司,應(yīng)當(dāng)避免過度依賴通用大模型,而應(yīng)更加注重構(gòu)建自身在垂直領(lǐng)域的專業(yè)能力和數(shù)據(jù)資源。
例如,針對(duì)法律、醫(yī)療、金融等特定行業(yè)開發(fā)專業(yè)模型,能夠更好地滿足高質(zhì)量、低風(fēng)險(xiǎn)的翻譯需求。
對(duì)于開展國(guó)際業(yè)務(wù)的中國(guó)企業(yè)來說,選擇語言服務(wù)供應(yīng)商時(shí)不能僅考慮價(jià)格因素,而應(yīng)更加重視其質(zhì)量保障能力和風(fēng)險(xiǎn)控制水平,尤其是在關(guān)鍵業(yè)務(wù)領(lǐng)域如合同翻譯、產(chǎn)品本地化和營(yíng)銷內(nèi)容制作等方面。
從投資和創(chuàng)新的角度來看,語言人工智能產(chǎn)業(yè)鏈上仍存在許多有價(jià)值的方向,例如小語種數(shù)據(jù)資源的建設(shè)、面向特定行業(yè)的翻譯質(zhì)量評(píng)估工具,以及語音翻譯和手語翻譯等新興領(lǐng)域。
這些細(xì)分市場(chǎng)可能在未來幾年迎來新的發(fā)展機(jī)會(huì)。
本文來源:騰訊平臺(tái)創(chuàng)作者 東針