從文本提示生成結(jié)構(gòu)化文檔的制作方法

文檔序號(hào)：39724215發(fā)布日期：2024-10-22 13:20閱讀：2來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專(zhuān)利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

背景技術(shù)：

1、以下內(nèi)容總體上涉及機(jī)器學(xué)習(xí)，并且更具體地涉及用于文檔處理的機(jī)器學(xué)習(xí)。

2、數(shù)字文檔編輯(或文檔處理)是指使用計(jì)算機(jī)或其他電子設(shè)備對(duì)數(shù)字文檔進(jìn)行更改的過(guò)程。這可能包括添加、刪除、或修改文檔中的文本、圖像、和其他內(nèi)容。各種應(yīng)用或工具可以支持用于創(chuàng)建和編輯文檔的不同功能，并且這些工具可以用于創(chuàng)建和編輯各種各樣的文檔。此外，數(shù)字文檔可以用于各式各樣的通信任務(wù)，包括正式文檔的復(fù)制、通過(guò)在線(xiàn)廣告、社交媒體帖子、傳單、海報(bào)、廣告牌、web和移動(dòng)應(yīng)用原型等進(jìn)行通信。

技術(shù)實(shí)現(xiàn)思路

1、本公開(kāi)描述了用于文檔處理的系統(tǒng)和方法。本公開(kāi)的實(shí)施例包括被配置為基于來(lái)自用戶(hù)的提示，生成結(jié)構(gòu)化文檔(例如，photoshop文檔(psd)、可移植文檔格式(pdf)文檔等)的文檔處理裝置。文檔處理裝置可以基于提示來(lái)生成文本嵌入、基于文本嵌入來(lái)生成潛在向量、并且對(duì)潛在向量進(jìn)行解碼以獲得用于結(jié)構(gòu)化文檔的多個(gè)文檔資源(asset)(例如，圖像資源)。文檔處理裝置然后可以通過(guò)組合文檔資源(例如，組合成不同的層，諸如背景層和前景層)來(lái)創(chuàng)建結(jié)構(gòu)化文檔。因此，文檔處理裝置可以用于創(chuàng)建連貫的結(jié)構(gòu)化文檔(例如，而不是簡(jiǎn)單的圖像)。

2、描述了用于文檔處理的機(jī)器學(xué)習(xí)的方法、裝置、非暫態(tài)計(jì)算機(jī)可讀介質(zhì)、和系統(tǒng)。該方法、裝置、非暫態(tài)計(jì)算機(jī)可讀介質(zhì)、和系統(tǒng)的一個(gè)或多個(gè)方面包括：獲得包括描述多個(gè)元素的文檔描述的提示；使用生成神經(jīng)網(wǎng)絡(luò)，基于提示來(lái)生成多個(gè)圖像資源，其中多個(gè)圖像資源與文檔描述的多個(gè)元素相對(duì)應(yīng)；以及生成匹配文檔描述的結(jié)構(gòu)化文檔，其中結(jié)構(gòu)化文檔包括多個(gè)圖像資源和描述多個(gè)圖像資源之間的關(guān)系的元數(shù)據(jù)。

3、描述了用于文檔處理的機(jī)器學(xué)習(xí)的方法、裝置、非暫態(tài)計(jì)算機(jī)可讀介質(zhì)、和系統(tǒng)。該方法、裝置、非暫態(tài)計(jì)算機(jī)可讀介質(zhì)、和系統(tǒng)的一個(gè)或多個(gè)方面包括：獲得包括結(jié)構(gòu)化文檔和結(jié)構(gòu)化文檔的文檔描述的訓(xùn)練數(shù)據(jù)，其中結(jié)構(gòu)化文檔包括多個(gè)圖像資源和描述多個(gè)圖像資源之間的關(guān)系的元數(shù)據(jù)；以及使用訓(xùn)練數(shù)據(jù)，訓(xùn)練生成神經(jīng)網(wǎng)絡(luò)，其中生成神經(jīng)網(wǎng)絡(luò)被訓(xùn)練以基于文檔描述來(lái)生成多個(gè)圖像資源。

4、描述了用于文檔處理的機(jī)器學(xué)習(xí)的裝置、系統(tǒng)、和方法。該裝置、系統(tǒng)、和方法的一個(gè)或多個(gè)方面包括：至少一個(gè)存儲(chǔ)器組件；至少一個(gè)處理設(shè)備，耦合到至少一個(gè)存儲(chǔ)器組件，其中處理設(shè)備被配置為執(zhí)行存儲(chǔ)在至少一個(gè)存儲(chǔ)器組件中的指令；生成神經(jīng)網(wǎng)絡(luò)，包括存儲(chǔ)在至少一個(gè)存儲(chǔ)器組件中的參數(shù)，其中生成神經(jīng)網(wǎng)絡(luò)被配置為基于提示來(lái)生成多個(gè)圖像資源；以及文檔生成器，被配置為生成包括多個(gè)圖像資源和描述多個(gè)圖像資源之間的關(guān)系的元數(shù)據(jù)的結(jié)構(gòu)化文檔。

技術(shù)特征：

1.一種方法，包括：

2.根據(jù)權(quán)利要求1所述的方法，還包括：

3.根據(jù)權(quán)利要求1所述的方法，還包括：

4.根據(jù)權(quán)利要求3所述的方法，還包括：

5.根據(jù)權(quán)利要求3所述的方法，其中：

6.根據(jù)權(quán)利要求1所述的方法，還包括：

7.根據(jù)權(quán)利要求6所述的方法，還包括：

8.根據(jù)權(quán)利要求1所述的方法，其中：

9.一種方法，包括：

10.根據(jù)權(quán)利要求9所述的方法，還包括：

11.根據(jù)權(quán)利要求9所述的方法，還包括：

12.根據(jù)權(quán)利要求11所述的方法，還包括：

13.根據(jù)權(quán)利要求9所述的方法，其中：

14.根據(jù)權(quán)利要求9所述的方法，其中：

15.一種系統(tǒng)，包括：

16.根據(jù)權(quán)利要求15所述的系統(tǒng)，還包括：

17.根據(jù)權(quán)利要求16所述的系統(tǒng)，其中所述解碼器包括變分自編碼器vae模型的解碼器。

18.根據(jù)權(quán)利要求15所述的系統(tǒng)，還包括：

19.根據(jù)權(quán)利要求18所述的系統(tǒng)，其中所述文本編碼器包括多模態(tài)文本編碼器，所述多模態(tài)文本編碼器被配置為在聯(lián)合嵌入空間中對(duì)文本和圖像進(jìn)行編碼。

20.根據(jù)權(quán)利要求18所述的系統(tǒng)，其中所述生成神經(jīng)網(wǎng)絡(luò)包括基于unet架構(gòu)的擴(kuò)散模型。

技術(shù)總結(jié)
本公開(kāi)實(shí)施例涉及從文本提示生成結(jié)構(gòu)化文檔。提供了用于文檔處理的系統(tǒng)和方法。該系統(tǒng)和方法的一個(gè)方面包括獲得包括描述多個(gè)元素的文檔描述的提示。使用生成神經(jīng)網(wǎng)絡(luò)，基于提示來(lái)生成多個(gè)圖像資源。在一些情況下，多個(gè)圖像資源與文檔描述的多個(gè)元素相對(duì)應(yīng)。然后生成匹配文檔描述的結(jié)構(gòu)化文檔。在一些情況下，結(jié)構(gòu)化文檔包括多個(gè)圖像資源和描述多個(gè)圖像資源之間的關(guān)系的元數(shù)據(jù)。

技術(shù)研發(fā)人員：張新陽(yáng),趙文天,盧昕,簡(jiǎn)任超
受保護(hù)的技術(shù)使用者：奧多比公司
技術(shù)研發(fā)日：
技術(shù)公布日：2024/10/21

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專(zhuān)利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：張新陽(yáng),趙文天,盧昕,簡(jiǎn)任超
技術(shù)所有人：奧多比公司
我是此專(zhuān)利的發(fā)明人

該領(lǐng)域下的技術(shù)專(zhuān)家
如您需求助技術(shù)專(zhuān)家，請(qǐng)點(diǎn)此查看客服電話(huà)進(jìn)行咨詢(xún)。
1、李老師：1.計(jì)算力學(xué) 2.無(wú)損檢測(cè)
2、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
3、袁老師：1.計(jì)算機(jī)視覺(jué) 2.無(wú)線(xiàn)網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢(shì)感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專(zhuān)家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢(xún)問(wèn)留言已有0條留言

還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

日韩成人黄色,透逼一级毛片,狠狠躁天天躁中文字幕,久久久久久亚洲精品不卡,在线看国产美女毛片2019,黄片www.www,一级黄色毛a视频直播

從文本提示生成結(jié)構(gòu)化文檔的制作方法