時(shí)間:2022-11-18 14:15:13
序論:好文章的創(chuàng)作是一個(gè)不斷探索和完善的過(guò)程,我們?yōu)槟扑]十篇購(gòu)房意向書范例,希望它們能助您一臂之力,提升您的閱讀品質(zhì),帶來(lái)更深刻的閱讀感受。
購(gòu)房意向書范文1賣方(以下簡(jiǎn)稱甲方):
姓名:________ 身份證號(hào):________ 住址:________ 聯(lián)系電話:________
買方(以下簡(jiǎn)稱乙方):
姓名:________ 身份證號(hào):________ 住址:________ 聯(lián)系電話:________
第一條 甲方房屋坐落于;房屋建筑面積平方米(其中套內(nèi)建筑面積______平方米);房屋用途為;該房屋附屬物_____面積平方米。
第二條 該房屋(包括附屬物)總價(jià)款為人民幣元整。
第三條該房屋為濟(jì)南鐵路局職工房改房,房屋產(chǎn)權(quán)證尚未正式辦理下來(lái),甲方保證在交易時(shí)該房屋產(chǎn)權(quán)明晰沒(méi)有產(chǎn)權(quán)糾紛。有關(guān)抵押債務(wù)、稅項(xiàng)及物業(yè)水電費(fèi)等,甲方均在交易前辦妥。交易后如有上述未清事項(xiàng),由甲方承擔(dān)全部責(zé)任。
第四條 甲方負(fù)責(zé)該房屋產(chǎn)權(quán)證辦理手續(xù)并承擔(dān)相關(guān)的辦理費(fèi)用,該房屋的面積如有變動(dòng),以房管部門測(cè)繪后新出測(cè)繪圖所載為準(zhǔn)。
第五條 甲乙雙方以誠(chéng)意負(fù)責(zé)的態(tài)度進(jìn)行該房屋的產(chǎn)權(quán)交易事宜,并為規(guī)避交易風(fēng)險(xiǎn),就交易步驟作如下約定。
第一步、甲乙雙方約定時(shí)間到對(duì)該房屋現(xiàn)場(chǎng)查看并由甲方就該房屋實(shí)際狀況向乙方說(shuō)明。
第二步、甲乙雙方約定時(shí)間到房管部門確認(rèn)該房屋的產(chǎn)權(quán)及相關(guān)情況,并在確認(rèn)后,由乙方向甲方支付定金人民幣元整,同時(shí)甲乙雙方簽訂本意向書。
第三步、甲方應(yīng)在收取定金后,于年月日之前辦理完結(jié)該房屋的房屋產(chǎn)權(quán)證。
第四步、甲方在房屋產(chǎn)權(quán)證辦理完結(jié)后到所轄派出所辦理戶口遷出手續(xù)并知會(huì)乙方。然后,甲乙雙方約定時(shí)間辦理網(wǎng)簽和過(guò)戶手續(xù),同時(shí)乙方向甲方支付人民幣元整先行款。
第五步、甲方應(yīng)于收到乙方先行款后日內(nèi)向乙方交房,乙方在收房查驗(yàn)后將尾款人民幣元整支付給甲方。
第六條 因本房屋所有權(quán)轉(zhuǎn)移所發(fā)生的契稅等稅費(fèi)由甲乙雙方各自依法向國(guó)家交納,其他費(fèi)用,依據(jù)政府規(guī)定各自承擔(dān)。
第七條 如需通過(guò)中介機(jī)構(gòu)辦理房屋買賣事宜,中介費(fèi)用由乙方負(fù)擔(dān)。
第八條 本意向書簽訂后,如乙方提出不購(gòu)買該房屋,乙方已支付定金甲方不予退還。如甲方提出不出售該房屋給乙方,應(yīng)在提出之日后5個(gè)工作日內(nèi)返還給乙方雙倍定金。
第九條 本意向書內(nèi),空格部分填寫的文字與印刷文字具有同等效力。本意向書中未規(guī)定的事項(xiàng),均遵照中華人民共和國(guó)有關(guān)法律、法規(guī)和政策執(zhí)行。
第十條 本意向書在履行中發(fā)生爭(zhēng)議,由甲、乙雙方協(xié)商解決。
第十一條 本意向書經(jīng)甲、乙雙方簽字之日起生效。
第十二條 本意向書共2頁(yè),一式二份,甲、乙雙方各執(zhí)一份,均具有同等效力。
甲方(簽章):_______
乙方(簽章):________
______年______月______日
______年______月______日
購(gòu)房意向書范文2購(gòu)房意向書
賣方(以下簡(jiǎn)稱甲方):姓名: 身份證號(hào):
住址:
聯(lián)系電話: 買方(以下簡(jiǎn)稱乙方):姓名: 身份證號(hào):
住址:
聯(lián)系電話:
第一條 甲方房屋坐落于 ;房屋建筑面積 平方 米(其中套內(nèi)建筑面積______平方米);房屋用途為 ;該房屋附屬物_____ 面積 平方米。
第二條 該房屋(包括附屬物)總價(jià)款為人民幣 元整。
第三條 該房屋為濟(jì)南鐵路局職工房改房,房屋產(chǎn)權(quán)證尚未正式辦理下來(lái),甲方 保證在交易時(shí)該房屋產(chǎn)權(quán)明晰沒(méi)有產(chǎn)權(quán)糾紛。有關(guān)抵押債務(wù)、稅項(xiàng)及物業(yè)水電費(fèi)等,甲方均在交易前辦妥。交易后如有上述未清事項(xiàng),由甲方承擔(dān)全部責(zé)任。
第四條 甲方負(fù)責(zé)該房屋產(chǎn)權(quán)證辦理手續(xù)并承擔(dān)相關(guān)的辦理費(fèi)用,該房屋的面積 如有變動(dòng),以房管部門測(cè)繪后新出測(cè)繪圖所載為準(zhǔn)。
第五條 甲乙雙方以誠(chéng)意負(fù)責(zé)的態(tài)度進(jìn)行該房屋的產(chǎn)權(quán)交易事宜,并為規(guī)避交易 風(fēng)險(xiǎn),就交易步驟作如下約定。第一步、甲乙雙方約定時(shí)間到對(duì)該房屋現(xiàn)場(chǎng)查看并由甲方就該房屋實(shí)際狀 況向乙方說(shuō)明。
第二步、甲乙雙方約定時(shí)間到房管部門確認(rèn)該房屋的產(chǎn)權(quán)及相關(guān)情況,并 在確認(rèn)后,由乙方向甲方支付定金人民幣 元整,同時(shí)甲乙雙方簽訂本 向書。
第三步、甲方應(yīng)在收取定金后,于 年 月 日之前辦理完結(jié)該房屋 的房屋產(chǎn)權(quán)證。
第四步、甲方在房屋產(chǎn)權(quán)證辦理完結(jié)后到所轄派出所辦理戶口遷出手續(xù) 并知會(huì)乙方。然后,甲乙雙方約定時(shí)間辦理網(wǎng)簽和過(guò)戶手續(xù),同時(shí)乙方向甲方支 付人民幣元整先行款。 第五步、甲方應(yīng)于收到乙方先行款后 日內(nèi)向乙方交房,乙方在收房 查驗(yàn)后將尾款人民幣 元整支付給甲方。
第六條 因本房屋所有權(quán)轉(zhuǎn)移所發(fā)生的契稅等稅費(fèi)由甲乙雙方各自依法向國(guó)家 交納,其他費(fèi)用,依據(jù)政府規(guī)定各自承擔(dān)。
第七條 如需通過(guò)中介機(jī)構(gòu)辦理房屋買賣事宜,中介費(fèi)用由乙方負(fù)擔(dān)。
第八條 本意向書簽訂后,如乙方提出不購(gòu)買該房屋,乙方已支付定金甲方不予 退還。如甲方提出不出售該房屋給乙方,應(yīng)在提出之日后5個(gè)工作日內(nèi)返還給乙方雙倍定金。
第九條 本意向書內(nèi),空格部分填寫的文字與印刷文字具有同等效力。本意向書中未規(guī)定
的事項(xiàng),均遵照中華人民共和國(guó)有關(guān)法律、法規(guī)和政策執(zhí)行。
第十條 本意向書在履行中發(fā)生爭(zhēng)議,由甲、乙雙方協(xié)商解決。
第十一條 本意向書經(jīng)甲、乙雙方簽字之日起生效。
第十二條 本意向書共2頁(yè),一式二份,甲、乙雙方各執(zhí)一份,均具有同等效力。 甲方(簽章): 乙方(簽章):
購(gòu)房意向書范文3(以下簡(jiǎn)稱承購(gòu)房)擬購(gòu)買由上海千葉房地產(chǎn)經(jīng)紀(jì)有
限公司(以下簡(jiǎn)稱房)所介紹的位于 的物業(yè),并認(rèn)
可以下條款:
一.承購(gòu)方愿意接受的購(gòu)房條件為:
1.購(gòu)房總價(jià):______________________________________.
2.包含設(shè)施:______________________________________.
3.簽約時(shí)間:______________________________________.
4.付款時(shí)間:______________________________________.
5.其他條件:______________________________________.
二.承購(gòu)方為表示購(gòu)房誠(chéng)意同意向方支付 的意向金,委托方于 年 月 日時(shí)之前去爭(zhēng)取出讓方的確定意向,一旦出讓方全部接受承購(gòu)方的上述購(gòu)買條件并在意向書上簽字,則承購(gòu)方授權(quán)方在不通知的情況下將意向金作為購(gòu)房定金付給出讓方,如果期限內(nèi)出讓方未能接受承購(gòu)方條件的,則意向金立即無(wú)息返還給承購(gòu)方。出讓方在本意向金書上簽字后,承購(gòu)方反悔不購(gòu)買或變更購(gòu)買條件等其他行為致使交易不成功的,定金(原意向金)將由出讓方?jīng)]收。
戴先生
A1:戴先生,您好!
購(gòu)房意向書的法律效力以及法律的性質(zhì),需要依據(jù)意向書的具體內(nèi)容進(jìn)行判斷。如果意向書中明確了所購(gòu)房子的具體房號(hào)并且標(biāo)明了價(jià)格、房屋交付等具體的約定內(nèi)容,這些約定基本符合了買賣合同成立的構(gòu)成要件,可以看成是一個(gè)附條件附期限的預(yù)約合同。在本案例中,意向書中已明確了雙方當(dāng)事人的基本情況、房屋地點(diǎn)、單價(jià)、面積、總房款、簽約日期等內(nèi)容,故應(yīng)將該意向書視為成立并有效的預(yù)約合同。
那么,購(gòu)房意向書存在合法的法律效力,如房東單方面提高價(jià)格,就涉嫌違約,一旦違約,買受人可通過(guò)訴訟的方式主張相應(yīng)賠償。故您可以通過(guò)訴訟的方式維護(hù)自己的權(quán)益,若意向書中規(guī)定了違約責(zé)任及違約金相關(guān)事宜,則您可以主張房東賠償違約金;若意向書中未作出相關(guān)規(guī)定,則您可以主張房東雙倍返還定金。
另外,根據(jù)我國(guó)《合同法》第一百一十六條規(guī)定,當(dāng)事人既約定違約金,又約定定金的,一方違約時(shí),對(duì)方可以選擇適用違約金或者定金條款。故您在主張賠償時(shí),可在雙倍返還定金及違約金(若事先有約定則可適用)中選擇其一進(jìn)行索賠。
但特別需要注意的是,若意向書中寫明交付的5萬(wàn)元是“訂金”,一方違約,另一方無(wú)權(quán)要求其雙倍返還,只能得到原額償還5萬(wàn)元。就訂金而言,沒(méi)有約定其作為定金性質(zhì)的,當(dāng)事人主張定金權(quán)利的,根據(jù)以往判例及相關(guān)法律法規(guī),人民法院不予支持,無(wú)法雙倍返還。
中介與房東之間構(gòu)成居間合同雙方當(dāng)事人,中介系居間人,房東系委托人。二手房買賣中,中介的活動(dòng)能否最后促成簽約具有不確定性,并非完全由中介的意志決定。中介與買賣雙方簽訂的是居間合同,根據(jù)居間合同的規(guī)定,在中介方無(wú)過(guò)錯(cuò)的情況下,無(wú)須對(duì)買賣雙方的違約行為承擔(dān)責(zé)任。中介的義務(wù)在于提供真實(shí)的信息,為雙方達(dá)成交易提供服務(wù)。故若您通過(guò)訴訟的方式來(lái)維護(hù)自己的權(quán)益,可以同時(shí)以中介和房東為被告。但具體而言,關(guān)于中介是否應(yīng)該承擔(dān)相應(yīng)責(zé)任,則須進(jìn)一步看其是否違反作為居間方的忠實(shí)義務(wù),才能判斷其是否有過(guò)錯(cuò)。若其有過(guò)錯(cuò),則需承擔(dān)相應(yīng)責(zé)任。
當(dāng)前,因房地產(chǎn)市場(chǎng)的快速發(fā)展,類似糾紛數(shù)量呈上升趨勢(shì)。很多房主在簽訂買賣合同后,看到房?jī)r(jià)漲幅巨大或因?yàn)槠渌鞣N主客觀因素,便在交付房屋或辦理房屋過(guò)戶手續(xù)前反悔,并尋找各種理由拒絕交房或干脆對(duì)買房人置之不理。遇到這種情況,守約一方在向人民法院提訟時(shí),建議選擇讓違約方承擔(dān)違約責(zé)任,解除房屋買賣合同,而不要選擇合同的繼續(xù)履行。
為了防止業(yè)主在房?jī)r(jià)上漲時(shí)毀約或買家在房?jī)r(jià)下跌時(shí)退房,建議在簽訂房屋買賣合同時(shí)約定較高的定金(但不可超過(guò)房屋交易價(jià)格的20%)或違約金,增加違約成本,違約成本大于或等于房?jī)r(jià)上漲或下跌的價(jià)值時(shí),可在一定程度上避免一方違約情況的發(fā)生。
Q2:王律師,你好!
兩個(gè)月前,我在一家中介機(jī)構(gòu)看中了一套房屋,該房屋位于上海市閘北區(qū)。當(dāng)時(shí)業(yè)務(wù)員介紹這套房子系房東委托中介掛牌出售的,房東當(dāng)時(shí)在外地。由于這套房屋地段較好,價(jià)格也較為合理,當(dāng)天我就在中介處簽下了一份購(gòu)房協(xié)議,交付了定金3萬(wàn)元,也約定了簽正式的購(gòu)房合同的日期。但是,兩個(gè)星期前房東表示要加價(jià)數(shù)十萬(wàn)元,否則不簽正式的購(gòu)房合同,這份意向書無(wú)效。我去找中介機(jī)構(gòu)交涉,但中介機(jī)構(gòu)說(shuō)當(dāng)時(shí)的購(gòu)房協(xié)議是以業(yè)務(wù)員私人名義簽下的,表示不愿負(fù)責(zé),同時(shí)出具了與房東之間的委托書,讓我找房東和業(yè)務(wù)員做交涉。請(qǐng)問(wèn),這種情況下我是否可以維護(hù)自己的利益?如果可以,我該怎么做?
楊女士
AZ:楊女士,您好!
購(gòu)房協(xié)議的法律效力需要依據(jù)該協(xié)議的具體內(nèi)容進(jìn)行判斷。若能夠構(gòu)成預(yù)約合同,則可以按照合同相關(guān)規(guī)定判斷合同雙方及中介方是否違約(在下文會(huì)具體進(jìn)行分析);若不能構(gòu)成預(yù)約合同,合同自始無(wú)效,則不可主張當(dāng)事方的違約責(zé)任,在這種情況下若要主張定金的返還,若符合不當(dāng)?shù)美臉?gòu)成要件,則可以以不當(dāng)?shù)美麨槔碛桑鲝埉?dāng)事方返還3萬(wàn)元。
如果購(gòu)房協(xié)議能夠視為成立并有效的預(yù)約合同,則預(yù)約合同中一切不違法的約定就是雙方當(dāng)事人應(yīng)當(dāng)遵守的義務(wù),具有法律效力。購(gòu)房協(xié)議存在合法的法律效力,如房東單方面提高價(jià)格,就涉嫌違約,一旦違約,買受人可通過(guò)訴訟的方式主張相應(yīng)賠償,故您可以通過(guò)訴訟的方式維護(hù)自己的權(quán)益。
我國(guó)《合同法》第四十九條規(guī)定:“行為人沒(méi)有權(quán)、超越權(quán)或者權(quán)終止后以被人名義訂立合同,相對(duì)人有理由相信行為人有權(quán)的,該行為有效。”我國(guó)法律明確作出了表見(jiàn)的相關(guān)規(guī)定,其意義在于維護(hù)制度的誠(chéng)信基礎(chǔ),保護(hù)善意第三人的合法權(quán)益,建立正常的民事流轉(zhuǎn)秩序。在本案例中,若中介未與房東辦妥相關(guān)委托手續(xù),即以房東的名義出賣房屋,屬無(wú)權(quán)。但若中介公司能夠提供相關(guān)信息材料,足以使不知情第三人相信其有權(quán)代表房屋產(chǎn)權(quán)人出賣房屋,可能構(gòu)成表見(jiàn)。且從中介與您所作出的關(guān)于購(gòu)房的相關(guān)約定等情節(jié)綜合考慮,可以排除中介與您惡意串通的可能,應(yīng)當(dāng)認(rèn)定您系善意第三人。中介以房東的名義向您出賣房屋的行為符合表見(jiàn)的構(gòu)成要件,買賣協(xié)議相應(yīng)的民事法律責(zé)任由房東承擔(dān)。至于中介方是否應(yīng)該承擔(dān)相應(yīng)責(zé)任,則屬于房東與中介方的糾紛問(wèn)題。
而至于業(yè)務(wù)員以個(gè)人名義與買受方簽訂購(gòu)房協(xié)議的問(wèn)題,若中介能夠出具與房東之間的書面委托書,證明該委托合法有效,并且該業(yè)務(wù)員確實(shí)是中介公司的正式員工,則業(yè)務(wù)員系以公司職員身份行使職權(quán)之內(nèi)的行為,責(zé)任由公司承擔(dān)。故只要業(yè)務(wù)員在行為過(guò)程中,未違反法律法規(guī)相關(guān)規(guī)定及公司章程等,則其自身并無(wú)過(guò)錯(cuò),相關(guān)法律責(zé)任由公司承擔(dān)。若意向書中規(guī)定了違約責(zé)任及違約金相關(guān)事宜,則您可以主張房東賠償違約金;若意向書中未作出相關(guān)規(guī)定,則您可以主張房東雙倍返還定金。
另外,當(dāng)事人既約定違約金,又約定定金的,一方違約時(shí),對(duì)方可以選擇適用違約金或者定金條款。故您在主張賠償時(shí),可在雙倍返還定金及違約金(若有事先約定則可適用)中選擇其一進(jìn)行索賠。
綜上,若該購(gòu)房協(xié)議不能夠認(rèn)定為成立并有效的預(yù)約合同,合同自始無(wú)效,則您只可能以不當(dāng)?shù)美麨槔碛芍鲝埉?dāng)事方返還3萬(wàn)元的不當(dāng)?shù)美粢嵩A,則應(yīng)以定金的收受方作為被告;若該購(gòu)房協(xié)議能夠認(rèn)定為預(yù)約合同,可以向法院提訟,以違約為理由主張當(dāng)事方雙倍返還定金或賠償協(xié)議約定的相應(yīng)違約金,可同時(shí)以房東及中介方作為被告,其中中介方是否應(yīng)該承擔(dān)連帶責(zé)任則需具體分析其是否違反忠實(shí)義務(wù)。
在二手房買賣糾紛中,常見(jiàn)的是買受方、中介方與出售方三方為當(dāng)事人。在此之中,中介與賣家雙方在委托房屋買賣交易時(shí),必須要有書面委托協(xié)議和正規(guī)授權(quán)證明才能代簽字。同時(shí),中介在與買家簽訂賣房合同時(shí),也必須出具賣家簽字的委托手續(xù),在沒(méi)有任何委托手續(xù)的前提條件下,僅口頭同意是無(wú)效的,中介也是無(wú)權(quán)的,中介與客戶簽訂的這份協(xié)議是無(wú)效的。若出現(xiàn)以上情況,如簽合同時(shí),對(duì)方不是房主本人,也沒(méi)有房主的委托書和身份證,要保留好該事實(shí)的證據(jù)材料,以此作為中介方未按照居間合同約定導(dǎo)致簽字主體錯(cuò)誤的證據(jù)。
甲方:
乙方:
本認(rèn)購(gòu)意向書在雙方平等自愿的基礎(chǔ)上,經(jīng)協(xié)商一致達(dá)成以下內(nèi)容 :
一、 房產(chǎn)信息
乙方意愿認(rèn)購(gòu)甲方
項(xiàng)目房屋 一 套,愿意支付人民幣元 (大寫:人民幣 萬(wàn)圓整)作為該意向登記的訂金(該筆款項(xiàng)可納入認(rèn)購(gòu)金或正式合同項(xiàng)下沖抵購(gòu)房款)。
意向房源基本情況:
意向一:房號(hào) :,建筑面積 平方米(最終以測(cè)繪機(jī)構(gòu)實(shí)測(cè)為準(zhǔn));
意向一:房號(hào) :,建筑面積 平方米(最終以測(cè)繪機(jī)構(gòu)實(shí)測(cè)為準(zhǔn));
以上意向房號(hào)僅為乙方單方意思表示,非為甲方發(fā)出的邀約,甲方不確保乙方具有優(yōu)先購(gòu)買該套房屋的資格。
二、 房產(chǎn)價(jià)格
房屋出售價(jià)格甲方于項(xiàng)目正式開盤前告知乙方,乙方可就告知的價(jià)格與甲方進(jìn)行協(xié)商,就經(jīng)協(xié)商一致的房屋價(jià)格簽署房屋認(rèn)購(gòu)書及房屋銷售合同。
三、其他約定事項(xiàng)
1、乙方應(yīng)于開盤認(rèn)購(gòu)當(dāng)日(具體時(shí)間以本公司告知為準(zhǔn))帶齊訂金收據(jù)、登記人身份證及本意向書到甲方招商中心,按預(yù)訂人順序進(jìn)行房屋認(rèn)購(gòu)。
2、如甲乙雙方就房屋售價(jià)價(jià)格經(jīng)協(xié)商未能達(dá)成一致的或就經(jīng)協(xié)商一致的房屋價(jià)格乙方未能按約定的期限與甲方簽署房屋認(rèn)購(gòu)書及房屋銷售合同的,該協(xié)商價(jià)格失效,本意向書亦自行失效,自該等事由發(fā)生之日起30個(gè)工作日內(nèi)甲方無(wú)息退還乙方交納的訂金。
3、房屋銷售合同項(xiàng)下的付款方式及付款期限于雙方簽署房屋認(rèn)購(gòu)書或正式簽訂房屋買賣合同時(shí)協(xié)商確定。
4、乙方如要求合同簽約的主體更名(僅指與簽署認(rèn)購(gòu)意向書的乙方名稱不一致)、調(diào)換已確定的房屋、或改變付款計(jì)劃的,應(yīng)于簽署房屋銷售合同前提出書面申請(qǐng),并須經(jīng)甲方同意。
5、本意向書一式三份,自雙方簽字蓋章后生效,甲方執(zhí)貳份,乙方執(zhí)壹份(簽署銷售合同時(shí)須提交甲方)。
出賣方(甲方): 認(rèn)購(gòu)方(乙方):
[中圖分類號(hào)] R-092 [文獻(xiàn)標(biāo)識(shí)碼] A [文章編號(hào)] 1673-7210(2012)05(b)-0123-02
本研究中所謂中醫(yī)古籍圖像,是指中醫(yī)古籍文獻(xiàn)中所刊載的各類插圖而言。數(shù)量眾多、內(nèi)容豐富的中醫(yī)古籍圖像是中醫(yī)學(xué)知識(shí)除文字外表述的重要補(bǔ)充,也是中醫(yī)學(xué)知識(shí)最為直觀、形象的表達(dá)。然而當(dāng)前鮮見(jiàn)有關(guān)于中醫(yī)圖像的成規(guī)模、系統(tǒng)性研究,在中醫(yī)古籍?dāng)?shù)字化建設(shè)中,也未曾將圖像作為單獨(dú)的研究課題。2011年,中國(guó)中醫(yī)科學(xué)院基本科研業(yè)務(wù)費(fèi)第三批自主選題團(tuán)隊(duì)項(xiàng)目——“中醫(yī)古籍圖像分類整理研究”課題(ZZ03076),首次對(duì)中醫(yī)古籍圖像資源進(jìn)行了系統(tǒng)的調(diào)研,并搜集到大量的圖片資料[1],由此中醫(yī)醫(yī)史文獻(xiàn)研究者第一次全面而系統(tǒng)的掌握了如此海量的圖像資源,這確為一件幸事。
然而如果繼續(xù)沿用傳統(tǒng)的文獻(xiàn)學(xué)和史學(xué)的方法對(duì)數(shù)量如此眾多的圖像進(jìn)行整理研究,單憑人工的方法就已顯得力不從心。因此借助于現(xiàn)代信息技術(shù)的數(shù)據(jù)庫(kù)技術(shù),實(shí)現(xiàn)對(duì)古籍圖像的管理,并利用知識(shí)管理的理論方法,對(duì)圖像資源進(jìn)行標(biāo)引,將大大提高古籍圖像研究的深度,并對(duì)從整體上把握?qǐng)D像的分類具有很好的規(guī)范作用。本研究擬探討一個(gè)集中醫(yī)古籍圖像管理與應(yīng)用功能為一體的數(shù)據(jù)平臺(tái)的構(gòu)建方案。
1 系統(tǒng)設(shè)計(jì)
中醫(yī)古籍圖像數(shù)據(jù)平臺(tái)擬采用多層化、模塊化和組件化的理念進(jìn)行架構(gòu)設(shè)計(jì),構(gòu)建一個(gè)分布式應(yīng)用、集中式管理的WEB應(yīng)用系統(tǒng)平臺(tái)。該系統(tǒng)分為:數(shù)據(jù)資源層、加工管理層、查詢應(yīng)用層。
1.1 數(shù)據(jù)資源層
包括中醫(yī)古籍圖像、索引和系統(tǒng)3個(gè)數(shù)據(jù)庫(kù)。中醫(yī)古籍圖像數(shù)據(jù)庫(kù):存儲(chǔ)中醫(yī)古籍圖像文件及其標(biāo)引信息。索引數(shù)據(jù)庫(kù):存儲(chǔ)中醫(yī)古籍圖像數(shù)據(jù)庫(kù)中的索引信息,為高速查詢檢索提供數(shù)據(jù)層支持。系統(tǒng)數(shù)據(jù)庫(kù):存儲(chǔ)用戶信息和用戶產(chǎn)生的各類數(shù)據(jù)等。
1.2 加工管理層
包括圖像信息著錄、圖像主題標(biāo)引和用戶管理、內(nèi)容管理4個(gè)功能模塊。圖像信息著錄:為數(shù)據(jù)加工人員提供對(duì)古籍圖像的外部信息進(jìn)行著錄、修改、審核的平臺(tái);圖像主題標(biāo)引:為圖像研究人員提供對(duì)圖像內(nèi)容進(jìn)行主題以及關(guān)系標(biāo)引的平臺(tái);用戶管理:為管理員提供管理用戶和用戶權(quán)限的工具;內(nèi)容管理:為管理員提供審核、刪除各類用戶在評(píng)注、交流、通訊過(guò)程中所產(chǎn)生相關(guān)內(nèi)容的工具。
1.3 查詢應(yīng)用層
包括檢索查詢、評(píng)注交流、統(tǒng)計(jì)報(bào)表、圖像網(wǎng)絡(luò)4個(gè)功能模塊。檢索查詢:向用戶提供圖像查詢和輸出功能;評(píng)注交流:為用戶提供學(xué)習(xí)、交流的平臺(tái);統(tǒng)計(jì)報(bào)表:為研究人員提供查詢結(jié)果統(tǒng)計(jì)報(bào)表及多種統(tǒng)計(jì)圖示生成的功能。圖像網(wǎng)絡(luò):為研究人員提供動(dòng)態(tài)圖像關(guān)系網(wǎng)絡(luò)展示功能。
2 系統(tǒng)功能
2.1 加工管理功能
2.1.1 圖像信息著錄 數(shù)據(jù)加工人員首先將經(jīng)過(guò)裁切、正畸、除污等技術(shù)處理過(guò)的圖像文件上傳進(jìn)本系統(tǒng),然后以張為單位,分別對(duì)圖像的各項(xiàng)外部信息進(jìn)行著錄。
2.1.2 圖像主題標(biāo)引 圖像研究人員可對(duì)圖像的分類、關(guān)系、主題等內(nèi)容信息進(jìn)行標(biāo)引。①分類標(biāo)引:按照多種分類體系,對(duì)每張圖像進(jìn)行多重標(biāo)引;②關(guān)聯(lián)標(biāo)引:根據(jù)構(gòu)建圖像網(wǎng)絡(luò)的需要,對(duì)圖像間的等同、版本、組圖、衍化等關(guān)系進(jìn)行標(biāo)引;③主題標(biāo)引:以《中國(guó)中醫(yī)藥學(xué)主題詞表》[2]作為工具,對(duì)圖像所反映的內(nèi)容主題進(jìn)行標(biāo)引。
2.1.3 用戶管理 管理員可對(duì)在系統(tǒng)中工作或使用者,賦予不同的角色類型,并對(duì)用戶的權(quán)限進(jìn)行管理。
2.1.4 內(nèi)容管理 管理員可對(duì)系統(tǒng)中各類用戶在使用過(guò)程中產(chǎn)生的諸如留言、評(píng)注、筆記、通訊等各類信息進(jìn)行審核管理。
2.2 查詢應(yīng)用功能
2.2.1 檢索查詢 系統(tǒng)向用戶提供簡(jiǎn)單查詢、組合查詢、關(guān)聯(lián)查詢3種方式。①簡(jiǎn)單查詢:用戶可以通過(guò)輸入單一的圖像信息或主題詞作為條件,檢索相應(yīng)的圖像;②組合查詢:用戶可以通過(guò)輸入組合的圖像信息或主題詞作為條件,檢索相應(yīng)的圖像;③關(guān)聯(lián)查詢:用戶可以一張圖像作為中心,檢索與其相關(guān)的其他圖像。以上查詢結(jié)果,均可按照年代、作者、主題等條件進(jìn)行排序。
2.2.2 評(píng)注交流 為用戶提供對(duì)古籍圖像進(jìn)行筆記、批注的功能;為加工人員及科研人員提供一個(gè)問(wèn)題交流、討論、反饋的機(jī)制;提供加工管理層與查詢應(yīng)用層之間用戶間點(diǎn)對(duì)點(diǎn)的通訊功能。目的是為用戶搭建一個(gè)科研學(xué)習(xí)的虛擬平臺(tái)。
2.2.3 統(tǒng)計(jì)報(bào)表 按照年代、作者、類型、刊刻單位、版本、流傳等條件統(tǒng)計(jì)分析圖像數(shù)目,生成報(bào)表或其他圖示形式。
2.2.4 圖像網(wǎng)絡(luò) 按照?qǐng)D像間的關(guān)聯(lián),生成圖像網(wǎng)絡(luò)。以展示圖像的主題關(guān)系以及流傳譜系。
3 系統(tǒng)實(shí)現(xiàn)
系統(tǒng)功能實(shí)現(xiàn)的基礎(chǔ)為中醫(yī)古籍圖像數(shù)據(jù)庫(kù),以下簡(jiǎn)要介紹一下數(shù)據(jù)庫(kù)主要表的結(jié)構(gòu)(圖2)。
3.1 圖像表
①圖像編碼(主鍵):識(shí)別圖像的標(biāo)識(shí)。②圖名:圖像的名稱,原有圖名的沿用原圖名;原沒(méi)有圖名的可自擬圖名,也可為空。③出處(外鍵):古籍圖像所出自的古籍及其版本。④特征:圖像諸如彩圖、墨圖、雕版、手繪等形態(tài)特征。⑤分類:圖像的分類號(hào)。⑥關(guān)聯(lián):圖像相關(guān)的其他圖像的編碼。⑦主題詞:描述圖像內(nèi)容的主題詞,域值為《中國(guó)中醫(yī)藥學(xué)主題詞表》。⑧有無(wú)圖像:布爾值。⑨圖像文件:鏈接圖像的文件。⑩備注:關(guān)于圖像其他信息的備注說(shuō)明。
3.2 書目表
①古籍編碼(主鍵):識(shí)別古籍的標(biāo)識(shí)。②書名:古籍的正題名,以《中國(guó)中醫(yī)古籍總目》[3]的題名著錄作為主要參考。③版本:古籍的版本,以《中國(guó)中醫(yī)古籍總目》的版本著錄作為主要參考。④總目號(hào):古籍在《中國(guó)中醫(yī)古籍總目》中的編號(hào)。⑤主要責(zé)任者:古籍的編者、著者等。⑥次要責(zé)任者:古籍的校注者、增補(bǔ)者等。⑦成書時(shí)間:古籍成書的時(shí)間。⑧刊刻時(shí)間:版本刊刻的時(shí)間。⑨內(nèi)容提要:對(duì)古籍作者、成書、版本、主要內(nèi)容等的概括性介紹。⑩載圖數(shù):古籍所刊載的圖像數(shù)量。館藏單位(外鍵):古籍的館藏單位。借閱號(hào):一般為館藏單位為古籍編制的財(cái)產(chǎn)號(hào)。
3.3 館藏單位表
①館藏單位編碼(主鍵):識(shí)別館藏單位的標(biāo)識(shí),以《中國(guó)中醫(yī)古籍總目》的館藏地代碼為參照。②館藏單位名稱:館藏單位的名稱。③地址:館藏單位的地址。④聯(lián)系人:古籍借閱聯(lián)系人的姓名。⑤聯(lián)系方式:古籍借閱聯(lián)系人的聯(lián)系方式。
4 相關(guān)基礎(chǔ)研究
中醫(yī)古籍圖像數(shù)據(jù)平臺(tái)的構(gòu)建,技術(shù)實(shí)現(xiàn)僅是其中一方面的工作,關(guān)于中醫(yī)古籍圖像的分類研究,分類體系的建立以及主題標(biāo)引的規(guī)范,才是研究的難點(diǎn)和重點(diǎn)之所在。系統(tǒng)功能研究成果的水平,主要取決于以上基礎(chǔ)性研究工作的進(jìn)展情況。
“中醫(yī)古籍圖像分類整理研究”課題先期取得的成果,為圖像系統(tǒng)性研究提供了很好的示范和指導(dǎo)作用,希望以此平臺(tái)的構(gòu)建為契機(jī),整合起分散于全國(guó)的人力、智力和古籍圖像資源,為中醫(yī)古籍圖像的進(jìn)一步深入、系統(tǒng)、可持續(xù)的研究奠定良好的基礎(chǔ)。
[參考文獻(xiàn)]
[1] 秦秋.我國(guó)首次開展中醫(yī)古籍圖像研究[N].中國(guó)中醫(yī)藥報(bào),2011-12-16(001).
1.前言
傳統(tǒng)的基于內(nèi)容的圖像檢索系統(tǒng),是利用圖像的底層特征進(jìn)對(duì)圖像進(jìn)行檢索的。主要工作集中在對(duì)圖像的顏色、紋理、空間關(guān)系等特征的識(shí)別,及對(duì)相關(guān)的圖像特征匹配的相似度度量上。通常這種方式都是采用順序的檢索算法實(shí)現(xiàn)的。然而面對(duì)如今海量的圖像庫(kù),那么圖像特征向量的相似性比較計(jì)算就非常復(fù)雜,因此利用這種順序的方法是非常低效的。受樹形結(jié)構(gòu)的啟發(fā),將圖像庫(kù)進(jìn)行預(yù)處理,先對(duì)圖像庫(kù)進(jìn)行聚類,然后在層次聚類的基礎(chǔ)上再進(jìn)行匹配,以樹的結(jié)構(gòu)進(jìn)行檢索。
2.詞匯樹的生成
2.1 關(guān)鍵詞模型
通過(guò)圖像的自動(dòng)分割,將圖像分為很多有意義的圖像區(qū)域,對(duì)每個(gè)圖像區(qū)域分別提取特征,這樣圖像將用一系列的局部特征來(lái)描述,每一個(gè)局部特征都是描述一小塊圖像的向量,然后根據(jù)局部特征的相似性對(duì)圖像進(jìn)行比較。圖1顯示兩個(gè)圖像如何通過(guò)提取局部特征與特征匹配進(jìn)行比較和區(qū)分。
這樣把來(lái)自許多圖像的局部特征,通過(guò)聚類劃分特征空間,形成了一系列視覺(jué)詞匯。因此,每一個(gè)圖像被簡(jiǎn)單的用一組離散的關(guān)鍵詞來(lái)表示。為了檢索,我們可以建立一個(gè)圖像視覺(jué)詞匯的索引,其類似于傳統(tǒng)的關(guān)鍵詞搜索引擎檢索文本文件的方法。
2.2 詞匯樹的建立
詞匯樹是一種高效的基于視覺(jué)詞匯檢索圖像的數(shù)據(jù)結(jié)構(gòu)。面對(duì)海量的圖像庫(kù),一個(gè)樹狀結(jié)構(gòu)允許在次線性時(shí)間內(nèi)進(jìn)行的關(guān)鍵詞查詢,而不是掃描全體關(guān)鍵詞去尋找匹配的圖片,這樣就大幅度的提高了檢索速度。
我們將訓(xùn)練樣本圖像輸入,這樣可以提取到大量的圖像特征,詞匯樹學(xué)習(xí)使用分層k-均值法。詞匯樹的形成需要控制兩個(gè)參數(shù):水平數(shù)量L指定的樹的高度,分支因子B指定的子節(jié)點(diǎn)的數(shù)量。一個(gè)視覺(jué)詞匯就是詞匯樹中的節(jié)點(diǎn),它是每一次聚類的聚類中心。作為傳統(tǒng)的詞袋模型,它代表圖像中一個(gè)臨近特征空間的小局部區(qū)域。該結(jié)構(gòu)的層次布局與非層次的詞袋表示相比,允許我們快速地量化特征。在分支因子為B,樹的高度為L(zhǎng)的詞匯樹在中,視覺(jué)詞匯的數(shù)目為:
(1)
樹的布局如圖2描述。
3.圖像的匹配
詞匯樹不僅直接定義了視覺(jué)詞匯的概念,同時(shí)指出了一種有效的檢索過(guò)程。樹的每個(gè)節(jié)點(diǎn),也就是樹的視覺(jué)詞匯,與一個(gè)倒排文件相關(guān)聯(lián),在這個(gè)文件中保存著包含該視覺(jué)詞匯的訓(xùn)練樣本圖像的儲(chǔ)存指針列表,同時(shí)該文件也一直在不斷地追蹤該視覺(jué)詞匯出現(xiàn)在每幅圖片中的頻率。通過(guò)對(duì)圖像局部特征的提取和量化,將目標(biāo)圖像q用一組特征點(diǎn)來(lái)表示,其中t為詞匯樹中節(jié)點(diǎn)的數(shù)量。與q類似的圖像,通過(guò)查找與q的特征一致的視覺(jué)詞匯的相關(guān)圖像,可以快速被找到。然后,通過(guò)對(duì)每個(gè)視覺(jué)詞匯的表決,為這些圖像排序。參加表決的方法如同普通的基于內(nèi)容的快速圖像檢索。通過(guò)比較目標(biāo)圖像q的特征向量和數(shù)據(jù)庫(kù)中待檢索圖像的特征向量在詞匯樹中自上而下的路徑相似程度,計(jì)算兩幅圖像的距離,我們可以確定兩幅圖片的相似性。
在范數(shù)下,將查詢圖像q和數(shù)據(jù)庫(kù)圖像d兩幅圖像的距離定義為:
(2)
在2范數(shù)的定義下,兩幅圖像的相似性度量公式簡(jiǎn)化為:
(3)
在2范數(shù)下的相似性計(jì)算公式使得查詢圖像和數(shù)據(jù)庫(kù)圖像的距離度量轉(zhuǎn)化為其特征向量對(duì)應(yīng)維度上同時(shí)為非零元素的累積求和。用這種方法使得檢索效率得到較大提高。
4.檢索結(jié)果
本實(shí)驗(yàn)的數(shù)據(jù)庫(kù)采用corel圖片庫(kù)。圖3是查詢和返回的結(jié)果。
在圖3中,左上角為目標(biāo)圖像,緊接著后面的12幅圖像的是系統(tǒng)返回的檢索結(jié)果。從實(shí)驗(yàn)結(jié)果中可以看出,盡管存在著視角、尺度的不同,但是,檢索的結(jié)果具有較高的正確率。
我們分別對(duì)corel圖像庫(kù)中的十類圖像進(jìn)行了檢索,從檢索結(jié)果來(lái)看,本文的算法都具有比較高的檢索準(zhǔn)確率,要說(shuō)明的是對(duì)于非洲人物的圖像集,檢索準(zhǔn)確率相對(duì)比較低,原因在于這類圖像的背景較為復(fù)雜,對(duì)于局部特征的提取受圖像干擾的影響較大所致。通過(guò)實(shí)驗(yàn),我們得出,圖像檢索中對(duì)于圖像特征的提取以及查詢圖像的量化過(guò)程,計(jì)算時(shí)間是比較快的,然而對(duì)于圖像集中的圖像的特征量化過(guò)程是比較慢。那么當(dāng)我們面向?qū)嶋H的用戶時(shí),這部分的計(jì)算是通過(guò)對(duì)圖像數(shù)據(jù)庫(kù)的預(yù)處理完成的,可以離線進(jìn)行,是不會(huì)影響用戶的查詢時(shí)間。
5.小結(jié)
隨著科技的發(fā)展,面對(duì)當(dāng)今海量的圖像庫(kù),傳統(tǒng)的檢索方法已經(jīng)不能很好的滿足人們的需求。本文利用詞匯樹結(jié)構(gòu)進(jìn)行圖像檢索,為從海量的圖像庫(kù)中檢索目標(biāo)圖像提供一條新思路。從實(shí)驗(yàn)結(jié)果來(lái)看,利用這種方法檢索效率以及檢索準(zhǔn)確性都有顯著的提高。
參考文獻(xiàn)
[1]陸建江,張亞非,徐偉光等.智能檢索技術(shù)[M].北京:科學(xué)出版社,2009,135-150.
[2]楊曉強(qiáng).基于顏色量化與聚類的圖像檢索算法[J].微計(jì)算機(jī)信息,2008,V24(3-4):272-287.
[3]謝東升.基于文本的圖片搜索引擎研究[D].上海:同濟(jì)大學(xué),2008.
中圖分類號(hào):TP391.12 文獻(xiàn)標(biāo)識(shí)碼:A
1 引言
漢語(yǔ)是一種大字符集語(yǔ)言,漢字?jǐn)?shù)量大、結(jié)構(gòu)復(fù)雜,漢字字形描述和特征計(jì)算方法是漢字信息處理的一項(xiàng)基礎(chǔ)研究,對(duì)于各種漢字處理應(yīng)用和漢字教學(xué)都有重要意義。前人對(duì)漢字字形描述做過(guò)很多工作,一般是把漢字的構(gòu)形方式按照人的認(rèn)知分類,并使用人認(rèn)知的部件、筆畫來(lái)描述。這些描述確實(shí)對(duì)相當(dāng)多的漢字有效,但也存在著大量的歧義和描述缺失,無(wú)法支持字形特征的自動(dòng)提取、分析和計(jì)算。由于缺少統(tǒng)一有效的字形形式化描述體系和字形特征計(jì)算方法,造成目前漢字處理應(yīng)用中存在一系列障礙,主要方面列舉如下:
各種漢字識(shí)別輸入(包括手寫識(shí)別輸入)軟件,受到識(shí)別原理的限制,只能識(shí)別訓(xùn)練集內(nèi)的漢字,無(wú)法輸入集外的漢字。
漢語(yǔ)教學(xué)和國(guó)際推廣都需要對(duì)錯(cuò)字進(jìn)行定量分析,如錯(cuò)字的描述、界定、分類、計(jì)算機(jī)輔助漢字書寫學(xué)習(xí)、書寫水平標(biāo)準(zhǔn)化自動(dòng)評(píng)測(cè)等,但目前計(jì)算機(jī)沒(méi)有錯(cuò)字輸入和比較的方法,嚴(yán)重制約了對(duì)錯(cuò)字進(jìn)行深入定量分析研究的水平。
漢字文本識(shí)別后的校對(duì)處理、涉及漢字的歷史文化研究(如古籍字、異體字的比對(duì)、界定)等應(yīng)用都需要分析漢字字形的相似性,但目前也沒(méi)有支持這種字形分析計(jì)算的有效方法。
獨(dú)立建立的集外字表因缺少有效比對(duì)工具而難以共享和歸并。
各種電子出版物以及網(wǎng)絡(luò)出版物中有許多集外字,這些字可以輸出,但讀者無(wú)法輸入,從而也無(wú)法查詢、檢索包含這些字的內(nèi)容。
因此,建立一種統(tǒng)一有效的漢字字形形式化描述體系和基于該體系的字形特征計(jì)算方法,能涵蓋所有正字和錯(cuò)字字形,并支持字形特征的自動(dòng)計(jì)算,對(duì)解決漢字處理面臨的這些問(wèn)題具有重要意義。本文給出了一種漢字網(wǎng)格字形描述方法,實(shí)驗(yàn)表明,該方法具有描述一切可能漢字字形(包括錯(cuò)字)骨架的能力,并支持自動(dòng)提取不同顆粒度構(gòu)字元素、結(jié)構(gòu)關(guān)系等字形特征,為字形特征自動(dòng)分析計(jì)算提供了一種可行、有效的手段,從而也為基于字形計(jì)算的各種應(yīng)用建立了基礎(chǔ)。
2 漢字字形主要描述方法分析
許多學(xué)者看到,目前漢字處理方法存在的問(wèn)題是把漢字整體作為編碼單位來(lái)處理,這樣就無(wú)法分析計(jì)算其內(nèi)部成分。實(shí)際上,漢字字形是可以分解來(lái)劃分結(jié)構(gòu)類型的,并且以部件、筆畫作為基本的構(gòu)形單位。從這樣的觀點(diǎn)出發(fā),有一批研究成果。代表性方法如下:
(1)漢字信息字典
上海交通大學(xué)漢字編碼組編,科學(xué)出版社1988年出版。主要特點(diǎn)是將漢字遞歸地分解成部件和筆畫的組合,組合的結(jié)構(gòu)類型有左右、上下、包容、嵌入4種,描述了7785個(gè)漢字。
(2)漢字部件規(guī)范(GF3001-1997)
國(guó)家語(yǔ)言文字工作委員會(huì)于1997年12月1日,主要特點(diǎn)是窮盡式地列出了國(guó)家標(biāo)準(zhǔn)通用多八位編碼字符集中20 902個(gè)漢字的部件表,并把集內(nèi)漢字依據(jù)這些部件進(jìn)行了逐個(gè)拆分。
(3)表意文字描述序列IDS(Ideographic Description Characters Sequence)
Unicode聯(lián)盟于2000年提出的表意文字描述符系統(tǒng),作為Unieode 4.0標(biāo)準(zhǔn)。主要特點(diǎn)是將漢字遞歸地分解為部件的組合,組合的結(jié)構(gòu)類型有12種。將結(jié)構(gòu)類型符作為操作符,漢字或部件作為操作數(shù)來(lái)組成前綴表達(dá)式,可以表現(xiàn)Unicode集內(nèi)的絕大部分漢字和一些集外漢字的字形。從實(shí)現(xiàn)的效率考慮,對(duì)表達(dá)式的長(zhǎng)度和其中連續(xù)排列的部件個(gè)數(shù)有限制。部件集合不固定,同一漢字的描述方法也不固定。IDS的出現(xiàn),反映了ISO也認(rèn)識(shí)到單純用擴(kuò)充編碼的方法支持更多漢字是行不通的,只有從漢字的構(gòu)形出發(fā),才能真正解決漢字的計(jì)算機(jī)表示問(wèn)題。
(4)漢語(yǔ)文檔處理語(yǔ)言CPL(Chinese Document Processing Language)
臺(tái)北“中研院”信息技術(shù)研究所文獻(xiàn)處理實(shí)驗(yàn)室在20世紀(jì)90年代開發(fā),為古籍整理服務(wù)。主要特點(diǎn)是將漢字遞歸地分解成部件和字根的組合,組合的結(jié)構(gòu)類型有直連、橫連、包含三種,還有幾種重疊形式。確定出1千多字根,表現(xiàn)4千多部件,涵蓋了5萬(wàn)多字形。并用CPL作為其研發(fā)的漢字構(gòu)形數(shù)據(jù)庫(kù)的字形描述語(yǔ)言。
(5)漢字?jǐn)?shù)學(xué)表達(dá)式
國(guó)防科技大學(xué)孫星明,殷建平,陳火旺等于2002年提出,將漢字遞歸地分解為部件的組合,組合類型有6種(左右,上下,左下包,左上包,右上包,全包含),固定出505個(gè)部件。并給出了關(guān)于結(jié)構(gòu)類型的結(jié)合律和傳遞律,使得字內(nèi)任意兩個(gè)部件的結(jié)構(gòu)關(guān)系能通過(guò)逐層的推導(dǎo)而得以確定。
(6)字符描述語(yǔ)言CDL(Character Description Language)
美國(guó)加州大學(xué)伯克利分校研究人員2003年提出的基于筆畫和部件的字形描述系統(tǒng),并采用XML作為元語(yǔ)言。主要特點(diǎn)是將漢字遞歸地分解為部件的組合,最底層的部件是筆畫。CDL沒(méi)有結(jié)構(gòu)類型的概念。它處理部件間位置關(guān)系的核心思想是:每個(gè)部件有一個(gè)隱藏的外包矩形輪廓,通過(guò)改變外包矩形斜對(duì)角頂點(diǎn)的坐標(biāo)來(lái)達(dá)到移動(dòng)和縮放對(duì)應(yīng)部件的目的。小部件(可能是筆畫)的外包矩形移動(dòng)和縮放后成為大部件或整字。CDL筆畫集合是固定的,筆畫的形狀用它的起點(diǎn)、終點(diǎn)、拐點(diǎn)的橫、縱坐標(biāo),以及走向和彎曲方向表示。CDL沒(méi)有固定的部件集合,所以它描述字形有極大的靈活性,可以描述各種可以想見(jiàn)的漢字,可以表現(xiàn)異體字的特異性。再者,它對(duì)筆畫的描述,不僅表示出了形狀,而且表示出了走向和彎曲方向,可用于漢字書寫方法的教學(xué)。
以上各種字形描述方法的共同思想是把漢字看作大部件到小部件的遞歸組合,因而有很強(qiáng)的字形能產(chǎn)性,一定程度上克服了大字符集方案的封閉性弊病。這幾種方案都是面向人的字形描述體系。字形拆分的主要原則是漢字的字理,這些原則對(duì)于一般大眾和沒(méi)有漢字文化背景的外國(guó)人而言仍很難使用;另一方面,描述中都采用了漢字教學(xué)中引入的結(jié)構(gòu)類型思想。這一思想對(duì)于面向人的教學(xué)確實(shí)很有效,但并不適合進(jìn)行計(jì)算機(jī)處理。因?yàn)橄喈?dāng)多漢字的結(jié)構(gòu)類型是有歧義的,有些字到底是上下結(jié)構(gòu)還是包圍結(jié)構(gòu)或是獨(dú)體部件,依賴于人的認(rèn)知。比如“著”是左上包圍結(jié)構(gòu),而“眷”不看成左上右三包圍結(jié)構(gòu)卻看成上下結(jié)構(gòu),就很費(fèi)解。“乘”看成“北” 包圍“禾”,“裹”看成“衣”包圍“果”,則需要專業(yè)知識(shí)。“卡”的中間一橫應(yīng)歸在上半部還是歸在下半部,則是見(jiàn)仁見(jiàn)智。一個(gè)字由于結(jié)構(gòu)類型的認(rèn)知不同,從而描述不同而會(huì)被計(jì)算機(jī)誤識(shí)成兩個(gè)字。而拆分標(biāo)準(zhǔn)不統(tǒng)一、不規(guī)范,也難以被機(jī)器實(shí)現(xiàn)。
相對(duì)而言,CDL只固定筆畫不固定部件,直接列出位置坐標(biāo)而不劃分結(jié)構(gòu)類型,一定程度上避免了前幾種方案的缺點(diǎn)。但是,CDL固定筆畫,以筆畫作為基本特征的顆粒度過(guò)大,影響了特征抽取和比較的效果。如“我”和“找”特征很相似,但是由于字中間是一橫還是兩橫造成兩個(gè)字的結(jié)構(gòu)類型、部件有極大差別。又如“單”同“草”、“卓”相似度很高,但中間一豎穿進(jìn)了“日”,造成描述相差非常大。對(duì)于這類差別,這幾種方案都能表現(xiàn)出來(lái),使得不同字形不被混淆,但卻不能很好表現(xiàn)相似性的程度。而字形相似性比較功能存在大量的應(yīng)用需求,應(yīng)當(dāng)是字形描述系統(tǒng)具備的重要能力。如果這些計(jì)算能力存在局限,就難以支持這些應(yīng)用。
手寫漢字識(shí)別方法依靠字形特征來(lái)識(shí)別漢字,描述了訓(xùn)練集內(nèi)不同字形的差別特征,對(duì)訓(xùn)練集內(nèi)字的處理能力很強(qiáng),但缺少訓(xùn)練集外字的特征,限制了對(duì)集外漢字的識(shí)別處理能力。
3 漢字網(wǎng)格字形描述及實(shí)驗(yàn)
漢字網(wǎng)格字形是一種采用平面網(wǎng)格結(jié)構(gòu)來(lái)描述漢字字形骨架的形式化方法。
3.1 網(wǎng)格字形描述
漢字字形網(wǎng)格是由n×n個(gè)小正方形合成的大正方形。
每個(gè)小正方形區(qū)域內(nèi)含有28個(gè)筆段:
各頂點(diǎn)到它所在邊中點(diǎn)的連線,共8段;
各頂點(diǎn)到它對(duì)邊中點(diǎn)的連線,以連線中點(diǎn)
為界分為2個(gè)筆段,共2×8=16段;
一對(duì)角線以中點(diǎn)為界分為2個(gè)筆段,共
2×2=4段。
整個(gè)網(wǎng)格有24n2+4n個(gè)筆段。
網(wǎng)格中每個(gè)筆段可取有線或無(wú)線兩種狀態(tài),所有有線的筆段分布構(gòu)成了漢字的網(wǎng)格字形描述。
在網(wǎng)格字形描述體系下,筆段為基元,所有的漢字字形(包括異體字、錯(cuò)字),都對(duì)應(yīng)網(wǎng)格中有線筆段的一種分布(但并非任意有線筆段分布都是一個(gè)可能的漢字)。有線筆段的不同分布可能對(duì)應(yīng)具有相同結(jié)構(gòu)或相似結(jié)構(gòu)的漢字。筆段類型編碼及網(wǎng)格字形描述如圖1所示。
3.2 基本筆畫描述
橫:從左向右、首尾相連的水平筆段所組成的序列。筆段編碼模式的正則式為A+;
豎:從上到下、首尾相連的垂直筆段所組成的序列。筆段編碼模式的正則式為B+;
撇:從右上到左下、左斜方向、傾角不增的首尾相連筆段所組成的序列。特別地,對(duì)撇尾接水平筆段、豎尾接左斜筆段的情況也作為撇來(lái)處理。筆段編碼模式的正則式為B*E+H*D*A*|B*H+D*A*|B*D+A;
捺:從左上到右下、右斜方向、傾角不增的首尾相連筆段所組成的序列。特別地,對(duì)捺尾接水平筆段、豎尾接右斜筆段的情況也作為捺來(lái)處理。筆段編碼模式序列的正則式為B*F+G*C*A*|B*G+C*A*|B*C+A*。
基本筆畫中起始筆段首端在網(wǎng)格字形中的位置定義為基本筆畫的首部,結(jié)束筆段尾端在網(wǎng)格字形中的位置定義為基本筆畫的尾部。因此,橫筆左端為首,右端為尾;豎筆上端為首下端為尾;撇筆右上端為首,左下端為尾;捺筆左上端為首,右下端為尾。
基本筆匭最小外包矩形在網(wǎng)格字形中的位置,定義為基本筆畫在網(wǎng)格字形中的位置。網(wǎng)格字形中基本筆畫圖例如表1所示。
3.3 復(fù)合筆畫描述
在網(wǎng)格字形中,復(fù)合筆畫刻畫書寫時(shí)由基本筆畫首尾或尾尾連接得到的靜態(tài)大筆形,由基本筆畫的類型編碼模式及連接方式來(lái)定義。例如:“豎鉤”定義為基本筆畫類型模式為“1[3_13_2_3_3]”,且“尾尾”連接方式構(gòu)成的復(fù)合筆畫。這里用“尾+尾”表示兩個(gè)基本筆畫以尾部位置重合來(lái)連接。其中“+”表示位置重合,“~”表示位置很接近。各種復(fù)合筆畫類型詳細(xì)描述如表2所示。
基本筆畫連接歧義處理:
1)在一字中,“豎”和“橫”尾首相連時(shí),如果是“口”的組成部分,“豎”和“橫”不組合為“豎折”復(fù)合筆畫,算作兩個(gè)筆畫。如“口、國(guó)、回、四”等,其他情況組合為“豎折”復(fù)合筆畫,如“山、區(qū)、葛、斷”等。
2)在一字中,“撇”和“橫”尾首相連時(shí),如橫是“門”或“門”的組成部分,“撇”和“橫”不組合成“撇折”復(fù)合筆畫。如“白、自、奧”等,其他情況組合為“撇折”復(fù)合筆畫。如“幺、去”等。
3)在一字中,出現(xiàn)“橫”的尾部同時(shí)連接“豎”的首和“撇”的尾時(shí),“橫”優(yōu)先與“豎”組合為“橫折”復(fù)合筆畫,而不作為“撇尾帶橫”處理。如“的”。
4)在一字中,出現(xiàn)“橫”的首部同時(shí)連接“豎”的尾和“撇”的尾時(shí),“橫”優(yōu)先與“豎”組合為“豎折”復(fù)合筆畫,而不與“撇”組合為“撇折”。如“區(qū)”。
3.4 筆畫位置關(guān)系描述
漢字字形是一種二維平面圖形,字形中筆畫間的相對(duì)位置關(guān)系是字形描述的重要組成部分。在網(wǎng)格字形中,兩筆畫間的位置關(guān)系可以采用方向關(guān)系矩陣來(lái)描述。設(shè)A是網(wǎng)格字形中任意筆畫,A與其他筆畫的相對(duì)位置描述如下:以A的最小外包矩形各邊及其延長(zhǎng)線作為邊界,將網(wǎng)格平面化分為以A為中心的3行3列呈“井”字分布的9個(gè)平面區(qū)域,分別表示筆畫A周圍的8個(gè)不同方位,如圖2所示。對(duì)各區(qū)域從上到下、從左到右按行、列編號(hào),例如,1行1列區(qū)域表示筆畫A的左上區(qū)域,3行3列區(qū)域表示筆畫A的右下區(qū)域,建立一個(gè)3×3的二值方陣R,元素R[i,j]值表示某筆畫B的最小外包矩形區(qū)域與筆畫A周圍的第i行j列區(qū)域相交的情況:如與該區(qū)域相交,R[i,j]=1,否則R[i,j]=0,因此,方陣R的值表示了A,B的位置關(guān)系。方陣R稱為A,B的方向關(guān)系矩陣。圖2表示“心”字第二點(diǎn)(標(biāo)為A的區(qū)域)外包矩形各邊及延長(zhǎng)線將網(wǎng)格平面劃分的9個(gè)區(qū)域,它與其他筆畫B、C、D的方向關(guān)系矩陣值如下:
類似地可以得出字形中任意兩筆畫間的方向關(guān)系矩陣。兩個(gè)字形對(duì)應(yīng)筆畫間方向關(guān)系矩陣的差值表示了字形結(jié)構(gòu)的差異度。此外,筆畫間的相交關(guān)系可直接通過(guò)交點(diǎn)坐標(biāo)來(lái)描述。兩字形中對(duì)應(yīng)筆畫交點(diǎn)數(shù)的差值表示了相交關(guān)系的差異度,相交關(guān)系作為位置關(guān)系的一種特例情況處理。
字形描述實(shí)驗(yàn)是采用自行開發(fā)的手寫繪制工具來(lái)進(jìn)行漢字的網(wǎng)格字形描述,目前,完成了GB2312字符集中全部6763個(gè)漢字、近1000個(gè)外國(guó)留學(xué)生漢語(yǔ)作文錯(cuò)字和部分異體字形的網(wǎng)格字形描述。并實(shí)現(xiàn)了網(wǎng)格字形中基本筆畫和復(fù)合筆畫的自動(dòng)提取,提取準(zhǔn)確率達(dá)到100%。實(shí)現(xiàn)了字形中筆畫間位置關(guān)系的自動(dòng)計(jì)算。實(shí)驗(yàn)表明,n一12的網(wǎng)格可以表示絕大多數(shù)漢字的字形,n=16的網(wǎng)格可以表示所有漢字的字形。這些實(shí)驗(yàn)結(jié)果說(shuō)明網(wǎng)格字形是一種可靠、有效和擴(kuò)展能力強(qiáng)的可計(jì)算字形描述模型。
4 結(jié)束語(yǔ)
網(wǎng)格字形描述方法,用定義好的有限方向的直線段――筆段作為描述單位,特征規(guī)范、顆粒度適當(dāng),克服了現(xiàn)有漢字字形描述體系存在的以下問(wèn)題:
1)以結(jié)構(gòu)類型、部件、筆畫作為描述單位,特征顆粒度過(guò)大,特征值集合固定,無(wú)法表現(xiàn)開放的漢字集合,無(wú)法比對(duì)一些相似字的差別。
2)點(diǎn)陣字形或TrueType曲線輪廓字形的描述基元顆粒度小,但規(guī)范性差,包含許多因書寫工具不同和美學(xué)觀念不同帶來(lái)的書法上的差別,這些差別不是漢字字形的本質(zhì)差別。
中圖分類號(hào):G42 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1673-7717(2009)05-0978-02
廣西中醫(yī)學(xué)院研究生院自2004年在中醫(yī)藥專業(yè)開設(shè)的《中西醫(yī)結(jié)合基礎(chǔ)實(shí)驗(yàn)技術(shù)與方法》課程,2005年改為《中西醫(yī)結(jié)合實(shí)驗(yàn)技術(shù)與方法》受到研究生的歡迎,2006年以后改為《中醫(yī)藥科研實(shí)驗(yàn)方法與技術(shù)》并增加實(shí)驗(yàn)教學(xué),取得良好的教學(xué)效果,在此基礎(chǔ)上結(jié)合2006年廣西壯族自治區(qū)教育廳“十一五”中西醫(yī)結(jié)合實(shí)驗(yàn)教學(xué)中心建設(shè),提出“優(yōu)勢(shì)資源共享的中醫(yī)藥研究生綜合性《實(shí)驗(yàn)技術(shù)與方法》課程體系建設(shè)”的課題,意在加強(qiáng)研究生創(chuàng)新能力培養(yǎng)和提高研究生培養(yǎng)的質(zhì)量。國(guó)外的許多院校的實(shí)驗(yàn)技術(shù)課程多以每一種器官,系統(tǒng)所關(guān)聯(lián)的多個(gè)基礎(chǔ)學(xué)科內(nèi)容聯(lián)合起來(lái),進(jìn)行多學(xué)科的綜合性實(shí)驗(yàn)教學(xué)。國(guó)內(nèi)各院校比較,西醫(yī)類院校在研究生中開設(shè)實(shí)驗(yàn)技術(shù)課程較多,內(nèi)容廣課時(shí)多;多數(shù)在40學(xué)時(shí)以上。各學(xué)科的實(shí)驗(yàn)教學(xué)相互獨(dú)立進(jìn)行,各學(xué)科之間融會(huì)結(jié)合的較少。總體實(shí)驗(yàn)教學(xué)顯得廣泛、細(xì)致而各科知識(shí)較松散。而中醫(yī)院校在研究生中開設(shè)實(shí)驗(yàn)技術(shù)課程少學(xué)時(shí)短,內(nèi)容單一,多數(shù)中醫(yī)院校僅開分子生物學(xué)和實(shí)驗(yàn)動(dòng)物學(xué)兩門,且實(shí)驗(yàn)課時(shí)很少,造成中醫(yī)藥專業(yè)研究生實(shí)驗(yàn)?zāi)芰Σ睿荒苓m應(yīng)現(xiàn)代中醫(yī)藥科研發(fā)展的要求。本文結(jié)合本院在中醫(yī)藥專業(yè)研究生《實(shí)驗(yàn)技術(shù)與方法》課程構(gòu)建的實(shí)踐及問(wèn)題,探討如何以優(yōu)勢(shì)資源共享和教育創(chuàng)新思想為導(dǎo)向,構(gòu)建中醫(yī)院校中醫(yī)藥專業(yè)研究生《實(shí)驗(yàn)技術(shù)與方法》課程體系。
1 課程集各種最常用的現(xiàn)代實(shí)驗(yàn)方法和技術(shù)為一體
基于教育創(chuàng)新思想和跨學(xué)科跨專業(yè)聯(lián)合形式,跨學(xué)科協(xié)作編寫綜合性教材《中醫(yī)藥科研實(shí)驗(yàn)技術(shù)與方法》,教材內(nèi)容集生理學(xué)、病理學(xué)、生物化學(xué)、組織學(xué)、免疫學(xué)、分子生物學(xué)等學(xué)科的現(xiàn)代實(shí)驗(yàn)研究方法和技術(shù)為一身,教材涉及中醫(yī)藥科研選題、中醫(yī)藥研究方法、科研項(xiàng)目申報(bào)等科研基本要素,實(shí)驗(yàn)技術(shù)包含計(jì)算機(jī)與生物機(jī)能實(shí)驗(yàn)系統(tǒng)、膜片鉗技術(shù)、電子顯微技術(shù)、血清藥理學(xué)技術(shù)、細(xì)胞化學(xué)與免疫組化、肌電腦電心電技術(shù)、蛋白質(zhì)組學(xué)技術(shù)、層析電泳光譜技術(shù)、分離與提純技術(shù)、細(xì)胞培養(yǎng)技術(shù)、印跡雜交與RNA探針技術(shù)、PCR、DDPCR、BT-PCR技術(shù)等,是現(xiàn)代中醫(yī)藥科學(xué)實(shí)驗(yàn)的最常用、最前沿的實(shí)用技術(shù)。
2 整合優(yōu)勢(shì)資源以專題講座的形式授課
本課程由相關(guān)科室的教師8人組成,其中教授(科主任)4人,副教授3人,助理研究員1人。課程總學(xué)時(shí)30學(xué)時(shí),理論教學(xué)24學(xué)時(shí),每周3學(xué)時(shí),共8周,采用分章節(jié)、分內(nèi)容,由本專業(yè)掌握該項(xiàng)技術(shù)的教授、副教授以專題講座的形式授課。實(shí)驗(yàn)教學(xué)6學(xué)時(shí)/次,目前可供選擇的實(shí)驗(yàn)?zāi)K有6個(gè)。具體的實(shí)驗(yàn)內(nèi)容則采取與研究生本人的培養(yǎng)方向相一致或相類似的實(shí)驗(yàn)?zāi)K,由學(xué)生自由進(jìn)行選擇。
3 因人施教 因材施教 按專業(yè)和培養(yǎng)方向的不同分層次實(shí)驗(yàn)教學(xué)
創(chuàng)新教學(xué)是分層次地因人、因材、因?qū)I(yè)施教,不是單一標(biāo)準(zhǔn)的統(tǒng)一的要求。分層次教學(xué)是讓不同目的、不同發(fā)展方向的學(xué)生都有適合自己的學(xué)習(xí)內(nèi)容。要求主講教師對(duì)學(xué)生們的導(dǎo)師姓名、研究方向、專業(yè)特點(diǎn),有較全面地了解,并制定出不同層次實(shí)驗(yàn)?zāi)K。這樣可以有效地避免單一標(biāo)準(zhǔn)造成的人力、財(cái)力的浪費(fèi)。同時(shí)也讓每個(gè)學(xué)生有適合自己的學(xué)習(xí)和發(fā)展的目標(biāo)。
4 構(gòu)建完善的課程體系結(jié)構(gòu)
本課程為中醫(yī)藥專業(yè)研究生的專業(yè)基礎(chǔ)課程,使用教材為本院自編教材《中醫(yī)藥科研實(shí)驗(yàn)方法與技術(shù)》,教學(xué)內(nèi)容以中醫(yī)藥科研方法與技術(shù)介紹為主,注重中醫(yī)藥專業(yè)研究生科學(xué)素質(zhì)的培養(yǎng),強(qiáng)調(diào)基礎(chǔ)理論與實(shí)驗(yàn)技能的統(tǒng)一性和完整性。體現(xiàn)中醫(yī)與西醫(yī)相結(jié)合的特點(diǎn),使學(xué)生對(duì)當(dāng)前科學(xué)技術(shù)的新發(fā)展有更多的了解。本課程體系結(jié)構(gòu)分七章:第一章,緒論;第二章,中醫(yī)藥實(shí)驗(yàn)研究的選題;第三章,中醫(yī)藥實(shí)驗(yàn)研究的方法;第四章,科研項(xiàng)目的申報(bào)及注意事項(xiàng);第五章,實(shí)驗(yàn)研究的儀器設(shè)備及使用;第六章,實(shí)驗(yàn)研究的基本技術(shù)與方法;第七章,實(shí)驗(yàn)的常用技術(shù)與方法簡(jiǎn)介。
5 改革實(shí)驗(yàn)?zāi)K與考核評(píng)價(jià)方法
目前已開展的實(shí)驗(yàn)?zāi)K有:①肺通調(diào)水道動(dòng)物模型制備;②家兔中心靜脈壓測(cè)定;③動(dòng)物生命指標(biāo)(血壓,呼吸,心電,尿量)同步測(cè)定;④大鼠含藥血清的制備;⑤參觀相關(guān)實(shí)驗(yàn)儀器設(shè)備和細(xì)胞室;⑥模擬填寫科研項(xiàng)目申請(qǐng)書等實(shí)驗(yàn)?zāi)K供學(xué)生選擇。考核擬采用有利于研究生專業(yè)發(fā)展和個(gè)性發(fā)展的模塊式和等級(jí)制評(píng)分。模塊式就是將考核內(nèi)容按培養(yǎng)方向不同分為若干個(gè)考核模塊。等級(jí)制就是在每一個(gè)模塊按難易程度的不同分為若干個(gè)等級(jí),由學(xué)生按自身發(fā)展方向選擇。
6 課程實(shí)施中存在的問(wèn)題
網(wǎng)絡(luò)計(jì)算模式已得到廣泛應(yīng)用,Internet技術(shù)使全球范圍信息傳遞易于實(shí)現(xiàn),直到近期發(fā)展起來(lái)的電子商務(wù)也倍受業(yè)界關(guān)注。在企業(yè)內(nèi)部使用Internet技術(shù)建立的Intranet使企業(yè)能在信息基礎(chǔ)上實(shí)現(xiàn)現(xiàn)代化運(yùn)營(yíng)。在上述應(yīng)用中,網(wǎng)絡(luò)是支撐,信息源是基礎(chǔ),處理與應(yīng)用是精髓。就信息源而論,含有多種數(shù)據(jù)庫(kù)系統(tǒng)是客觀現(xiàn)實(shí),因歷史原因,有層次、網(wǎng)狀及關(guān)系數(shù)據(jù)庫(kù)系統(tǒng),還有近幾年發(fā)展起來(lái)的對(duì)象-關(guān)系及面向?qū)ο蟮臄?shù)據(jù)庫(kù)系統(tǒng)。對(duì)一個(gè)大的企業(yè),各部門使用不同的數(shù)據(jù)庫(kù)系統(tǒng)經(jīng)常出現(xiàn),不是人們刻意追求異構(gòu)數(shù)據(jù)庫(kù),而是現(xiàn)實(shí)中難以避免。即使是一個(gè)經(jīng)過(guò)信息規(guī)劃的企業(yè)部門,因時(shí)間推移,人遷,以及數(shù)據(jù)庫(kù)技術(shù)的發(fā)展和數(shù)據(jù)庫(kù)市場(chǎng)的變化,都可能造成異構(gòu)數(shù)據(jù)庫(kù)的局面。各數(shù)據(jù)庫(kù)公司的技術(shù)都在發(fā)展,也造成這些公司不同版本的數(shù)據(jù)庫(kù)系統(tǒng)并存。因此在網(wǎng)絡(luò)環(huán)境下,異構(gòu)數(shù)據(jù)庫(kù)存在,要求異構(gòu)數(shù)據(jù)庫(kù)聯(lián)合使用的要求會(huì)長(zhǎng)期存在下去。
對(duì)用戶而言,希望屏蔽掉各種層次的異構(gòu)特性,不必知道各物理數(shù)據(jù)庫(kù)系統(tǒng)的知識(shí),不必自己去進(jìn)行數(shù)據(jù)轉(zhuǎn)換和匯總結(jié)果,而簡(jiǎn)便的全局查詢得到一個(gè)綜合結(jié)果,這就是異構(gòu)數(shù)據(jù)庫(kù)聯(lián)合使用技術(shù)主要的研究?jī)?nèi)容。
:7000多字 參考文獻(xiàn)
200元
中圖分類號(hào):TP311文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1009-3044(2011)15-3727-02
An Ontology Matching Method for Heterogeneous Knowledge Integration in Animated Cartoon Project
ZHANG An-qi1,2, LIAO Liang-cai1, SONG Yang3
(1.College of Information System and Management, National University of Defense Technology, Changsha 410073, China; 2.Hunan Animated Cartoon Engineering and Technology Center, Changsha 410073, China; 3.Changsha Department, Hunan Mobile, Changsha 410073, China)
Abstract: Nowadays, there are many intractable problems in knowledge management and sharing under the ground of animated cartoon project management. In this paper, we applied ontology matching technique into the knowledge management of animated cartoon project management, and provide a solution for sharing common knowledge in developing animated cartoon project. Finally, we discuss the ontology matching techniques which are suitable for animated cartoon project knowledge management.
Key words: animated cartoon; ontology matching; knowledge management; project management
1 緒論
目前,數(shù)字卡通技術(shù)在我國(guó)得到了蓬勃發(fā)展。作為一種知識(shí)密集型的產(chǎn)業(yè),數(shù)字卡通的制作與開發(fā)過(guò)程中涉及到大量的結(jié)構(gòu)化和非結(jié)構(gòu)化的知識(shí),這些知識(shí)的分類和抽象、建模與形式化、集成與共享以及管理和重用等都是當(dāng)前需要深入研究的問(wèn)題[1]。
然而,由于當(dāng)前我國(guó)數(shù)字卡通制作企業(yè)在技術(shù)儲(chǔ)備和規(guī)模上仍然處于較低水平,大型數(shù)字卡通項(xiàng)目的開發(fā)通常需要多個(gè)企業(yè)協(xié)作完成。為了更好地實(shí)現(xiàn)資源共享和軟實(shí)力整合,需要加強(qiáng)對(duì)項(xiàng)目相關(guān)知識(shí)的管理和共享[2]。本文將本體匹配技術(shù)應(yīng)用到數(shù)字卡通項(xiàng)目異構(gòu)知識(shí)集成中,探討了如何通過(guò)本體匹配方式構(gòu)造異構(gòu)本體之間的結(jié)盟和映射,進(jìn)而實(shí)現(xiàn)異構(gòu)知識(shí)的共享和集成。
2 本體異構(gòu)性與本體匹配
本體是一種將領(lǐng)域知識(shí)概念化和模型化的方法,已經(jīng)被廣泛用于描述計(jì)算機(jī)能夠處理的據(jù)的語(yǔ)義信息[3]。然而,不同組織開發(fā)的本體所描述的領(lǐng)域可能相關(guān),也可能重疊;對(duì)相關(guān)聯(lián)領(lǐng)域的描述可能采用不同的語(yǔ)言和組織方式;而且對(duì)領(lǐng)域知識(shí)描述在側(cè)重點(diǎn)和詳細(xì)程度上也不可能完全相同[4]。因此,盡管使用本體的初衷是為了能夠?qū)︻I(lǐng)域知識(shí)的描述達(dá)成共識(shí),但是事實(shí)上實(shí)際應(yīng)用卻中出現(xiàn)了大量異構(gòu)本體,而且還將異質(zhì)問(wèn)題的提高到了更高的層次。本體的異質(zhì)性主要體現(xiàn)在如下幾個(gè)方面[5]:
① 由于使用不同的語(yǔ)言進(jìn)行領(lǐng)域描述而造成的本體語(yǔ)法異質(zhì)問(wèn)題。
② 由于同一實(shí)體在不同本體中命名的不同而造成的術(shù)語(yǔ)異質(zhì)問(wèn)題。
③ 由于對(duì)同一興趣領(lǐng)域建模的差別而造成的語(yǔ)義異質(zhì)問(wèn)題。
④ 由于對(duì)同一領(lǐng)域的描述在詳細(xì)程度上的不同而造成的粒度異質(zhì)問(wèn)題。
⑤ 由于在不同的上下文環(huán)境中對(duì)同一實(shí)體的解釋不同而造成的異質(zhì)問(wèn)題。
為了解決上述異構(gòu)問(wèn)題,通常通過(guò)本體匹配技術(shù)建立本體之間的語(yǔ)義映射。
定義1:本體可以定義為,其中:
C為本體類集合;P為本體屬性集合,區(qū)分為數(shù)據(jù)類型屬性和對(duì)象屬性;Ins為本體的實(shí)例集合; Rp?哿P是一系列關(guān)系屬性,包括對(duì)稱屬性、傳遞屬性、函數(shù)屬性和反函數(shù)屬性等;Hc?哿C×C為概念繼承層次結(jié)構(gòu);Hp?哿P×P為無(wú)環(huán)的屬性繼承層次結(jié)構(gòu);函數(shù)給定了屬性的定義域;函數(shù):給定了屬性的值域。其中對(duì)象屬性的值域是概念集合,而數(shù)據(jù)類型屬性的值域?yàn)閿?shù)值類型集合DR;函數(shù)card:C×PN描述了每個(gè)概念-屬性對(duì)的基數(shù)約束。
定義2:對(duì)應(yīng)(Correspondence)是異構(gòu)本體中實(shí)體之間的一種語(yǔ)義關(guān)系,通常通過(guò)特定的匹配算法來(lái)建立。
定義3:映射(Mapping):本體間的語(yǔ)義映射是一個(gè)三元組m=<OS,OT,r>,其中OS為源本體,OT為目標(biāo)本體,r為這兩種符號(hào)之間的語(yǔ)義關(guān)系,一般是指等價(jià)或者包含關(guān)系。
本體之間的映射根據(jù)具體應(yīng)用的不同其表達(dá)形式也有所不同,在本文中使用的語(yǔ)義映射是一種輕量級(jí)的本體映射,主要用途是建立本體元素之間的語(yǔ)義關(guān)聯(lián),為上層的推理服務(wù)提供支撐。
3 基于本體的異構(gòu)知識(shí)管理框架
數(shù)字卡通開發(fā)領(lǐng)域涉及到的知識(shí)面非常廣泛,包括來(lái)自政策法規(guī)、共性支撐技術(shù)、軟硬件設(shè)備、企業(yè)生產(chǎn)經(jīng)營(yíng)等多個(gè)方面,僅僅依靠單個(gè)本體很難對(duì)所有的知識(shí)統(tǒng)一建模。而且大一統(tǒng)的本體建模方式不僅費(fèi)時(shí)費(fèi)力,而且本體的可用性和靈活性都比較差。為了將分散在項(xiàng)目流程各個(gè)角落的知識(shí)相互關(guān)聯(lián)起來(lái),通常采用本體網(wǎng)絡(luò)來(lái)實(shí)現(xiàn)分布、異構(gòu)知識(shí)的建模。
項(xiàng)目知識(shí)共享是數(shù)字卡通項(xiàng)目知識(shí)管理的過(guò)程中扮演重要角色。在此可以給出圖1所示的知識(shí)共享與管理示意圖。通過(guò)異構(gòu)本體的匹配和集成,將各種異構(gòu)知識(shí)拼接和整合成一個(gè)本體網(wǎng)絡(luò),網(wǎng)絡(luò)中的每個(gè)節(jié)點(diǎn)就是一個(gè)面向具體應(yīng)用或者某一領(lǐng)域的本體,而網(wǎng)絡(luò)的邊就是本體間的映射,知識(shí)的傳遞、分發(fā)和管理都通過(guò)該核心的本體網(wǎng)絡(luò)來(lái)完成。本文假設(shè)相關(guān)的本體均已經(jīng)構(gòu)建完成,關(guān)鍵是探討如何構(gòu)建各種異構(gòu)本體之間的語(yǔ)義映射,即找到適用于數(shù)字卡通項(xiàng)目知識(shí)管理的本體匹配方法。
4 適用于數(shù)字卡通項(xiàng)目知識(shí)管理的本體匹配方法
本體匹配的目標(biāo)就是找到異構(gòu)本體中實(shí)體之間的聯(lián)系,如本體間的因果關(guān)系,包含關(guān)系和不相交關(guān)系等等。本體中的實(shí)體可能是復(fù)雜的表達(dá)式,如公式、概念定義、查詢和術(shù)語(yǔ)表達(dá)式等,通過(guò)匹配本體能夠使本體中所表現(xiàn)的知識(shí)和數(shù)據(jù)相互協(xié)作。在數(shù)字卡通項(xiàng)目協(xié)作開發(fā)過(guò)程中開發(fā)的本體,通常并不能進(jìn)行完全匹配,因此通過(guò)下述步驟實(shí)現(xiàn)本體匹配:
1)名稱匹配過(guò)程。通過(guò)通用匹配過(guò)程實(shí)現(xiàn)本體元素在名稱上的匹配。通常將實(shí)體名轉(zhuǎn)化為矢量來(lái)處理,使用歐氏距離和余弦相似度(公式1)等來(lái)測(cè)度實(shí)體之間的相似程度。
(1)
2)結(jié)構(gòu)匹配過(guò)程。對(duì)本體的結(jié)構(gòu)方面的信息,通常是對(duì)本體的局部結(jié)構(gòu)和全局結(jié)構(gòu)分別進(jìn)行進(jìn)一步匹配。Similarity flooding 是一種面向結(jié)構(gòu)的通用匹配算法,該算法的基本思想是節(jié)點(diǎn)間的相似度依賴于它們的相鄰節(jié)點(diǎn)的相似度。算法基本步驟為:
a將本體轉(zhuǎn)換為一個(gè)有向圖,其中節(jié)點(diǎn)為兩個(gè)本體的概念對(duì),如果兩個(gè)節(jié)點(diǎn)的概念對(duì)之間存在一定的關(guān)系則兩個(gè)節(jié)點(diǎn)之間存在一條邊;
b為邊分配權(quán)重,一般來(lái)說(shuō)如果源節(jié)點(diǎn)的出度為n,則邊的權(quán)重為1/n;
c為每個(gè)節(jié)點(diǎn)賦予初始相似度σ0,可以使用基本匹配方法來(lái)給出初始相似度;
d根據(jù)選擇的公式計(jì)算每一節(jié)點(diǎn)的σi+1相似度;
e將每個(gè)節(jié)點(diǎn)的σi+1相似度除以最大值以進(jìn)行標(biāo)準(zhǔn)化;
f如果相似度的變化不超過(guò)閾值ε,即|σi+1(e,e’)- σi (e,e’)|< ε。
3)實(shí)例匹配。關(guān)注本體實(shí)例層面,通常分為取值域的匹配和實(shí)例數(shù)據(jù)的匹配兩個(gè)方面。本文將實(shí)例匹配問(wèn)題單獨(dú)劃分出來(lái)單獨(dú)匹配,因?yàn)閷?shí)例匹配經(jīng)常需要人工參與。
4)匹配的補(bǔ)償。對(duì)于未能正確建立匹配的環(huán)節(jié)加以補(bǔ)償,這一步的工作是為了使匹配過(guò)程更加準(zhǔn)確。
基于上述步驟基本上能夠解決大多數(shù)本體異構(gòu)的問(wèn)題,進(jìn)而為消除數(shù)字卡通項(xiàng)目中的知識(shí)異構(gòu)問(wèn)題奠定基礎(chǔ)。
5 結(jié)論
在國(guó)家科技支持重點(diǎn)項(xiàng)目 “面向全網(wǎng)運(yùn)營(yíng)的數(shù)字卡通工程化技術(shù)研究與應(yīng)用”(2007BAH14B00)的支持之下,本文探討了適用于數(shù)字卡通項(xiàng)目知識(shí)管理背景的本體匹配的方法。后續(xù)研究會(huì)就這一問(wèn)題做更為深入的研究,給出相應(yīng)的原型系統(tǒng)。
參考文獻(xiàn):
[1] 楊鳴喚.中國(guó)動(dòng)漫產(chǎn)業(yè)存在的主要問(wèn)題及對(duì)策研究[D].上海:華東師范大學(xué),2007.
[2] 晃翠花,金鑫.基于本體的企業(yè)間信息協(xié)作的研究[J].東華大學(xué)學(xué)報(bào):自然科學(xué)版,2003,29(6):43-49.
[3] 陸建江,張亞菲,苗壯,等.語(yǔ)義網(wǎng)原理與技術(shù)[M].北京:科學(xué)出版社,2007.
高校藝術(shù)專業(yè)學(xué)生是未來(lái)社會(huì)主義接班人,將他們打造成為德藝雙馨的藝術(shù)家是高等教育的重要責(zé)任。因此加強(qiáng)對(duì)藝術(shù)專業(yè)學(xué)生思政教育成為當(dāng)前高校發(fā)展的重中之重。
一、高校藝術(shù)專業(yè)學(xué)生心理特征
(一)重技能輕文化
藝術(shù)專業(yè)學(xué)生進(jìn)入高校途徑有所不同,他們?cè)诟呖记靶枰釉嚕缓髤⒓游幕n考試才能夠進(jìn)入高校接受專業(yè)化藝術(shù)教育。相比較之下,藝術(shù)專業(yè)學(xué)生文化課分?jǐn)?shù)偏低,且高校招生僅關(guān)注其技能,對(duì)藝術(shù)專業(yè)學(xué)生產(chǎn)生了影響,使其更加關(guān)注專業(yè)技能,忽視了文化課學(xué)習(xí)。因此進(jìn)入高校的藝術(shù)專業(yè)學(xué)生文化課功底較弱,且思想政治素養(yǎng)較為匱乏。
(二)缺乏理想信念
認(rèn)為,社會(huì)意識(shí)是由社會(huì)存在決定。高校作為新思想、新觀念發(fā)源地,藝術(shù)專業(yè)學(xué)生經(jīng)過(guò)藝術(shù)熏陶,對(duì)于新鮮事物的敏銳度更高。因此藝術(shù)學(xué)生多思維活躍、性格活潑,對(duì)于新鮮事物的接受能力較強(qiáng)。但是藝術(shù)學(xué)生對(duì)自身未來(lái)發(fā)展定位較為模糊,極易受到不良現(xiàn)象的影響,造成理想信念缺失,社會(huì)責(zé)任感非常薄弱。
(三)紀(jì)律性不強(qiáng)
在校藝術(shù)專業(yè)學(xué)生多為90后,他們成長(zhǎng)在我國(guó)經(jīng)濟(jì)高速發(fā)展新時(shí)期,物質(zhì)與精神獲得了極大的滿足,具有鮮明的時(shí)代特征,情感豐富。一些術(shù)專業(yè)學(xué)生過(guò)于自信,活在自己營(yíng)造的藝術(shù)世界,目中無(wú)人[1]。常常只顧及自身利益,過(guò)于表現(xiàn)自己,缺乏紀(jì)律性。可見(jiàn),藝術(shù)專業(yè)學(xué)生思想政治教育效果不盡人意,還有待進(jìn)一步提升。
二、構(gòu)建高校藝術(shù)專業(yè)學(xué)生思想政治教育方法模式
(一)明確教育目標(biāo)
大學(xué)生接受教育最多的方式是課堂教學(xué),因此思政教育中,課堂是重要陣地。針對(duì)藝術(shù)專業(yè)學(xué)生特點(diǎn),應(yīng)將專業(yè)課與思政教育有機(jī)結(jié)合,兼顧專業(yè)教學(xué)與思政教育雙重需求。如在欣賞《自新大陸交響曲》過(guò)程中,教師可以結(jié)合德沃夏克寫作背景,將捷克對(duì)故鄉(xiāng)的思念之情表達(dá)出來(lái),使得學(xué)生在欣賞藝術(shù)作品的同時(shí),能夠更好地把握住作者的情懷。而美術(shù)系學(xué)生在欣賞美術(shù)作品時(shí),如《自由引導(dǎo)人民》,教師可以對(duì)作品內(nèi)涵進(jìn)行介紹,使學(xué)生深入理解作品,引導(dǎo)學(xué)生樹立堅(jiān)定的信念,使其能夠認(rèn)識(shí)到作為人民藝術(shù)家為人民、為民族、為國(guó)家服務(wù)的重要性,以此來(lái)達(dá)到教育學(xué)生的目的。
(二)滲透?jìng)鹘y(tǒng)文化
在思政教育中,教師要加強(qiáng)對(duì)傳統(tǒng)文化的滲透,提升民族自信心。中華傳統(tǒng)藝術(shù)形式種類繁多、博大精深。藝術(shù)建立在歷史、文學(xué)等基礎(chǔ)之上,具有較強(qiáng)的綜合性。因此藝術(shù)專業(yè)學(xué)生思政教育也應(yīng)堅(jiān)持該項(xiàng)原則,應(yīng)適當(dāng)延伸其深度和廣度,改變單一學(xué)習(xí)模式,深化對(duì)藝術(shù)知識(shí)的學(xué)習(xí),以此來(lái)提升自身鑒賞力[2]。除此之外,高校藝術(shù)專業(yè)還應(yīng)將戲劇、戲曲及京劇等融合到一起,豐富藝術(shù)體系,在此基礎(chǔ)上進(jìn)行思政教育,能夠提升學(xué)生思想境界,從而實(shí)現(xiàn)思政教育目標(biāo)。
(三)重視隱性教育
校園藝術(shù)活動(dòng)是校園生活的一部分,能夠豐富學(xué)生生活,且能夠達(dá)到隱性思政教育。首先,教師要從頂層入手,選擇恰當(dāng)?shù)那腥朦c(diǎn),采用多樣形式,以此來(lái)適應(yīng)新時(shí)代藝術(shù)學(xué)生心理特點(diǎn),為思政教育實(shí)踐活動(dòng)奠定堅(jiān)實(shí)的基礎(chǔ)。同時(shí),還可以利用節(jié)日等機(jī)會(huì),舉行與節(jié)日主題相一致的活動(dòng)。如清明節(jié)時(shí),可以舉行祭奠民族英雄的朗誦會(huì)等;中秋節(jié)舉行古典舞大賽等,將思政教育無(wú)形滲透至校園藝術(shù)活動(dòng)當(dāng)中,從而促進(jìn)學(xué)生思想發(fā)展。現(xiàn)階段,高校藝術(shù)文化活動(dòng)尚未形成完善的運(yùn)行機(jī)制,但出具雛形的校園文化已經(jīng)在各所高校開展[3]。如北大、清華等知名高校,舉辦的各類活動(dòng)等,既能夠在活動(dòng)中弘揚(yáng)愛(ài)國(guó)主義精神、還能夠體現(xiàn)大學(xué)精神。其他高校也可以根據(jù)自身特點(diǎn)和實(shí)際情況,舉辦相應(yīng)的活動(dòng)。如創(chuàng)作與校園生活、景觀等相關(guān)的藝術(shù)作品,使得學(xué)生能夠更好地傳承學(xué)生愛(ài)國(guó)等情結(jié),且能夠更好地營(yíng)造良好的教育環(huán)境。
三、結(jié)語(yǔ)
根據(jù)上文所述,藝術(shù)專業(yè)學(xué)生作為我國(guó)社會(huì)主義精神文明建設(shè)的重要力量,其思想、觀念正確與否直接決定了祖國(guó)未來(lái)發(fā)展。藝術(shù)專業(yè)學(xué)生與一般專業(yè)學(xué)生有所不同,個(gè)性鮮明、理想思想欠缺。因此高校應(yīng)樹立現(xiàn)代教育理念,以理想信念為基礎(chǔ),將愛(ài)國(guó)主義作為重點(diǎn),重視隱性教育,并積極滲透?jìng)鹘y(tǒng)文化,引導(dǎo)高校學(xué)生樹立正確思想觀念,在學(xué)習(xí)藝術(shù)內(nèi)涵的同時(shí),能夠培養(yǎng)學(xué)生優(yōu)秀的藝術(shù)品質(zhì),除此之外,教師也要樹立好榜樣,從而達(dá)到事半功倍的思想政治教育目標(biāo)。
參考文獻(xiàn):