文/北京集佳知識(shí)產(chǎn)權(quán)代理有限公司 潘曉松
近年來(lái),隨著人工智能(AI)技術(shù)的快速發(fā)展,美國(guó)專利商標(biāo)局(USPTO)針對(duì)專利主題適格性(subject matter eligibility),即專利客體問(wèn)題發(fā)布了更新指導(dǎo),以應(yīng)對(duì)AI相關(guān)權(quán)利要求評(píng)估的挑戰(zhàn)。本文基于USPTO 2024年7月發(fā)布的更新指導(dǎo)以及2024年12月底發(fā)布的培訓(xùn)材料中的Example 48、即“語(yǔ)音分離”判例,對(duì)主題適格性問(wèn)題進(jìn)行了探討。
一、法律框架:AI發(fā)明背景下的Alice/Mayo測(cè)試
根據(jù)相關(guān)指導(dǎo)和培訓(xùn)材料的指示,所有AI相關(guān)的軟件發(fā)明都必須通過(guò)源于最高法院判例的Alice/Mayo兩步法測(cè)試:
1.第一步(Step 2A, Prong One):權(quán)利要求是否“指向”(directed to)一個(gè)司法例外,如自然法則、自然現(xiàn)象或抽象概念。在AI領(lǐng)域,最常見(jiàn)的抽象概念包括“數(shù)學(xué)概念”(如數(shù)學(xué)關(guān)系、公式、算法)和“精神過(guò)程”(如人類可以通過(guò)思維完成的觀察、評(píng)估、判斷)。
2.第二步(Step 2A, Prong Two & Step 2B):如果第一步的答案為是,那么權(quán)利要求是否包含“顯著更多”(significantly more)的要素,從而將這個(gè)抽象概念轉(zhuǎn)化為具體的、具有創(chuàng)造性的應(yīng)用。
USPTO的最新指南強(qiáng)調(diào),在評(píng)估第二步之前,審查員應(yīng)首先在第一步的第二個(gè)分支(Prong Two)中判斷:權(quán)利要求作為一個(gè)整體,是否將司法例外“整合”(integrates)到了一個(gè)“具體的實(shí)踐應(yīng)用”(practical application)中?如果答案是肯定的,那么該權(quán)利要求就不再被視為“指向”抽象概念,從而直接滿足101條的要求,無(wú)需進(jìn)入更為嚴(yán)格的Step 2B分析。
二、Example 48詳細(xì)分析:基于AI的語(yǔ)音分離和識(shí)別
Example 48標(biāo)題為“使用深度神經(jīng)網(wǎng)絡(luò)的語(yǔ)音分離”,描述了一個(gè)在嘈雜環(huán)境中分離混合語(yǔ)音信號(hào)的系統(tǒng)、例如虛擬會(huì)議。該發(fā)明使用一種人工神經(jīng)網(wǎng)絡(luò)(深度神經(jīng)網(wǎng)絡(luò),DNN),用包含較少說(shuō)話者的混合語(yǔ)音信號(hào)對(duì)其進(jìn)行訓(xùn)練,訓(xùn)練后的網(wǎng)絡(luò)可分離更多聲源的語(yǔ)音信號(hào)。
1.不具主題適格性的權(quán)利要求1(Claim 1)
權(quán)利要求1描述了一個(gè)語(yǔ)音分離的方法,包括:
(a)接收包含多個(gè)不同聲源sn(其中n∈{1,…,N})語(yǔ)音的混合語(yǔ)音信號(hào)x;
(b)使用短時(shí)傅里葉變換將所述混合語(yǔ)音信號(hào)x轉(zhuǎn)換為時(shí)間-頻率域的頻譜圖,并獲取特征表示X,其中X對(duì)應(yīng)于所述混合語(yǔ)音信號(hào)x的頻譜圖和從所述混合語(yǔ)音信號(hào)x中提取的時(shí)間特征;
(c)使用深度神經(jīng)網(wǎng)絡(luò)(DNN)通過(guò)公式V=fθ(X)確定嵌入向量V,其中V=fθ(X)是所述混合語(yǔ)音信號(hào)x的全局函數(shù)。
USPTO的分析:該權(quán)利要求被認(rèn)定為“指向”抽象概念,因而不具備主題適格性。
?步驟(b)中的傅里葉變換是純粹的數(shù)學(xué)計(jì)算。
?步驟(c)中明確限定了一個(gè)數(shù)學(xué)公式,用于計(jì)算嵌入向量,這同樣屬于數(shù)學(xué)概念。
?雖然權(quán)利要求中提到了“接收信號(hào)”和使用“DNN”,但被認(rèn)為是高度概括性的。接收數(shù)據(jù)僅僅是常規(guī)的“數(shù)據(jù)收集活動(dòng)”(data gathering),而使用通用的DNN來(lái)執(zhí)行數(shù)學(xué)計(jì)算,則被視為“應(yīng)用它”(apply it)的指令,即將抽象的數(shù)學(xué)公式應(yīng)用在一個(gè)通用計(jì)算環(huán)境上。
核心結(jié)論:權(quán)利要求1的整體內(nèi)容僅僅是描述了一系列的數(shù)學(xué)運(yùn)算,從一個(gè)信號(hào)計(jì)算出另一個(gè)數(shù)據(jù)(嵌入向量),并未限定如何利用這個(gè)計(jì)算結(jié)果去解決實(shí)際的“語(yǔ)音分離”技術(shù)問(wèn)題。因此,未能將抽象的數(shù)學(xué)概念整合到具體的實(shí)踐應(yīng)用中。
2.具備主題適格性的權(quán)利要求2(Claim 2)——從抽象計(jì)算到具體技術(shù)實(shí)現(xiàn)
權(quán)利要求2是在權(quán)利要求1的基礎(chǔ)上進(jìn)一步限定的方法,增加了以下步驟:
(d)將所述嵌入向量V劃分為與不同聲源sn對(duì)應(yīng)的聚類;
(e)對(duì)所述聚類應(yīng)用二進(jìn)制掩碼,以生成帶掩碼的聚類;
(f)從所述帶掩碼的聚類中合成語(yǔ)音波形,其中每個(gè)語(yǔ)音波形對(duì)應(yīng)于不同的聲源sn;
(g)組合所述語(yǔ)音波形以生成混合語(yǔ)音信號(hào)x’,具體為:將與不同聲源sn對(duì)應(yīng)的語(yǔ)音波形拼接,排除目標(biāo)聲源ss的語(yǔ)音波形,使得所述混合語(yǔ)音信號(hào)x’包含來(lái)自不同聲源sn的語(yǔ)音波形,且不包含來(lái)自目標(biāo)聲源ss的語(yǔ)音波形;
(h)將所述混合語(yǔ)音信號(hào)x’傳輸至遠(yuǎn)程位置存儲(chǔ)。
USPTO的分析:該權(quán)利要求被認(rèn)定為具備適格性。
?步驟(h)中的“傳輸”屬于無(wú)關(guān)緊要的“非解決方案相關(guān)活動(dòng)”。
?步驟(f)和(g)通過(guò)記載 “深度神經(jīng)網(wǎng)絡(luò)如何輔助聚類分配以匹配混合語(yǔ)音信號(hào)中識(shí)別的聲源,隨后將這些聚類合成為時(shí)域中的分離語(yǔ)音波形,并轉(zhuǎn)換為排除非目標(biāo)聲源音頻的混合語(yǔ)音信號(hào)”,體現(xiàn)了說(shuō)明書中討論的改進(jìn)。
權(quán)利要求2的技術(shù)方案解決了“分離同類語(yǔ)音源的語(yǔ)音”的問(wèn)題,且無(wú)需預(yù)先知曉說(shuō)話者數(shù)量或進(jìn)行說(shuō)話者特定訓(xùn)練。
這些步驟體現(xiàn)了說(shuō)明書中描述的改進(jìn)。因此,該權(quán)利要求指向?qū)ΜF(xiàn)有計(jì)算機(jī)技術(shù)或語(yǔ)音分離技術(shù)的改進(jìn),且已將抽象概念整合為實(shí)際應(yīng)用。
總結(jié):Example 48代表了AI下§ 101分析的關(guān)鍵進(jìn)步,AI往往涉及數(shù)學(xué)模型,風(fēng)險(xiǎn)抽象,該判例強(qiáng)調(diào)了記載(recitation)例外與涉及(involve)例外的區(qū)分。權(quán)利要求1明確記載數(shù)學(xué)概念,而權(quán)利要求2同樣涉及數(shù)學(xué)概念但突出了整體權(quán)利要求分析,相關(guān)培訓(xùn)材料中指出,需要評(píng)估各個(gè)限定特征之間的相互關(guān)聯(lián)(例如權(quán)利要求2的步驟(f)和(g))。同時(shí),也提醒申請(qǐng)人,應(yīng)強(qiáng)調(diào)解決的技術(shù)問(wèn)題,而非僅結(jié)果。
參考資料:
1.Reminders on evaluating subject matter eligibility of claims under 35 U.S.C. 101;
2.2024 Guidance Update on Patent Subject Matter Eligibility, Including on Artificial Intelligence