信息抽取是指從多源異構的數(shù)據(jù)源中提取出實體、屬性以及實體之間的關系,在此基礎上形成本體化的知識表達,它是知識圖譜構建技術的關鍵[1]。早期信息抽取主要是基于預定規(guī)則的抽取技術,工作量龐大且*適用于特定的專業(yè)領域,后來人們開始嘗試使用統(tǒng)計機器學習的方法,通過標注部分數(shù)據(jù)得到訓練集,在此基礎上再使用均方根誤差算法(rootmeansquarederror,RMSE)或多項式回歸算法(polyno?mialregression,PR)等有監(jiān)督學習算法識別命名實體。將傳統(tǒng)統(tǒng)計質量控制中的事后檢驗轉變?yōu)槭孪?預測,重點是揭示隱藏在其中的有價值的模式和知識。信息化智慧導讀前景
數(shù)字化圖書館是圖書館發(fā)展的大趨勢,數(shù)字化圖書館不僅適應了現(xiàn)代化發(fā)展方向,在現(xiàn)實生活中,由于數(shù)字化圖書館包含了海量數(shù)據(jù)信息,其服務功能也越來越強大。隨著網(wǎng)絡的發(fā)展,數(shù)字化圖書館既是傳統(tǒng)圖書館優(yōu)勢的繼承和創(chuàng)新載體,又結合了網(wǎng)絡的便利性,與現(xiàn)代人的閱讀需要更為相符。研究中發(fā)現(xiàn)圖書館雖然在加速數(shù)字化圖書館的基礎設施建設方面做了很多工作,但還是存在著一些問題,如經(jīng)費投入、管理維護、資源建設和創(chuàng)新發(fā)展等方面。除了要解決這些問題,還要注意加大技術融合力度、加大經(jīng)費投入力度、加大對專業(yè)人才的培養(yǎng)。所以,要抓好數(shù)字化圖書館的技術創(chuàng)新和管理,創(chuàng)新管理方法和運行機制,提升用戶的整體滿意度。并且要整合好各種數(shù)字化圖書館資源,除了電子資源還要利用好紙質資源,擴展圖書館的綜合閱讀面,加大圖書館數(shù)字化技術的覆蓋面和受眾范圍的廣度,促進數(shù)字化圖書館更好地發(fā)展。智慧導讀哪家好從數(shù)據(jù)資源、數(shù)據(jù)分 析技術、數(shù)據(jù)價值性等角度闡述基于大數(shù)據(jù)構建知識務引擎體系。
用戶參與行為的具體分析可從三方面進行:***,行為構成。數(shù) 字閱讀類應用主要的參與行為除了瀏覽、互動和創(chuàng)造行為,還包括 標記、批注和收藏等閱讀過程中會發(fā)生的行為。另外,不同數(shù)字閱 讀類應用其用戶參與行為偏好有所側重。例如, 在具備聲覺空間型 和經(jīng)典抽象性媒介特性的喜馬拉雅聽書應用上,用戶偏重閱聽,從 而其中的參與行為會有所不同。根 據(jù)感官類 型和內(nèi)容 特 性的媒介 劃分可以明確用戶參與行為的一般構成,以及在某一媒介類型的參 與行為側重, 然后根據(jù)用戶研究方法進行定性分析,總結參與行為 構成的一般規(guī)律。第二,行為類型。用戶參與行為分 成圍觀式參與、話語式參與和行動式參與三種參與類型,對數(shù)字閱 讀類應用的使用過程中用戶所產(chǎn)生的參與行為包括瀏覽、搜尋、標 注、評論、收藏、分享等,根據(jù)參與程度將參與行為類型進行分類, 建立參與行為構成的影響要素與參與程度、閱讀體驗之間的內(nèi)在關 聯(lián)。
數(shù)字閱讀過程具有參與傾向:用戶參與賦予數(shù)字閱讀類應用巨大價值??萍嫉母咚侔l(fā)展與媒介的迭代創(chuàng)新使得用戶習慣于從判斷、計劃到實施的各個階段通通依賴于信息網(wǎng)絡執(zhí)行具體某類行為,而用戶體驗的友好程度對用戶決策產(chǎn)生影響所占的比重越來越大,因此,在互聯(lián)網(wǎng)行業(yè)中通過研究用戶行為,進而改良信息系統(tǒng)體驗流程的設計方法受到***關注。另外,數(shù)字閱讀行為基本承襲了紙本閱讀,例如,在閱讀過程中用戶會產(chǎn)生批注、標記、畫線、摘抄、評論、分享等行為,數(shù)字閱讀活動中用戶參與的行為傾向被進一步放大,用戶在閱讀體驗中的深度參與為數(shù)字閱讀類應用創(chuàng)造了巨大價值。網(wǎng)絡化的發(fā)展使圖書館在文獻服務形式上更加多元,包括音視頻、圖文等,可以滿足各類讀者的檢索服務需求。
網(wǎng)格技術在數(shù)字圖書館建設中的應用主要體現(xiàn)在以下幾個方面。***,網(wǎng)格技術為數(shù)字圖書館提供了技術平臺支持。在數(shù)字圖書館中,依靠網(wǎng)格技術能夠實現(xiàn)用戶的資源請求與館藏可用資源的有效匹配,同時對于多個請求的資源需求也可以依靠網(wǎng)格技術進行統(tǒng)籌安排,實現(xiàn)資源的優(yōu)化調度[7-12]。第二,網(wǎng)格技術具有較強的海量數(shù)據(jù)處理功能。現(xiàn)代數(shù)字圖書館擁有海量的數(shù)據(jù)信息,必須依靠相應的技術對數(shù)據(jù)進行處理,從而轉化為用戶需要的結果。在實際的檢索中,用戶只需用客戶端發(fā)出要求指令,網(wǎng)格便會合理分配信息,**終的執(zhí)行結果會很快反饋給用戶,從而**縮短了用戶的數(shù)據(jù)查詢和檢索時間,實現(xiàn)了高效檢索。第三,有利于資源共享。數(shù)字圖書館擁有豐富的信息資源,依靠網(wǎng)格技術的共享硬件、共享存儲、共享計算以及面向用戶的特點,可以充分實現(xiàn)文獻資源的***共享。上海半坡數(shù)字圖使館可以轉儲讀者所閱讀的文獻知識全文,為圖書館介入知識發(fā)現(xiàn)與服務奠定文獻儲備的基礎。互聯(lián)網(wǎng)智慧導讀標志
大數(shù)據(jù)環(huán)境下圖書館應該把讀者的閱讀行為、身份特征、個人愛好與習慣和社會關 系等隱私數(shù)據(jù)。信息化智慧導讀前景
數(shù)字圖書館不同于傳統(tǒng)意義上的實體圖書館,它是利用數(shù)字處理技術的圖書館,其實質是集計算機技術、通信技術、微電子技術于一體的現(xiàn)代信息服務系統(tǒng)。從數(shù)字圖書館的內(nèi)涵可以看出,數(shù)字圖書館包括以下幾個特征。***,館藏資源的數(shù)字化。在數(shù)字圖書館建設過程中,所有的館藏資源都需要提前進行數(shù)字化處理,從而形成具有一定規(guī)模且內(nèi)容和主題相對**的數(shù)字資源。第二,操作計算機化。數(shù)字圖書館建設,是實現(xiàn)對各類文獻信息資源的收集、加工、存儲、檢索、管理和傳輸,因而整個過程始終離不開計算機操作。第三,信息傳輸?shù)木W(wǎng)絡化。讀者獲取的文獻信息都是通過網(wǎng)絡進行傳輸?shù)摹5谒?,存取自由化。讀者可以隨時通過網(wǎng)絡查詢數(shù)字圖書館的文獻資源,打破了時空的限制。第五,資源共享和結構連接化。隨著網(wǎng)絡技術的不斷發(fā)展,數(shù)字圖書館基本上實現(xiàn)了資源共享,用戶在任何一個數(shù)字圖書館都可以享受“聯(lián)機檢索”服務。也正因為計算機技術的不斷發(fā)展和應用,數(shù)字圖書館的建設才有了相關技術保障。例如,數(shù)據(jù)挖掘技術、網(wǎng)格技術、智能Agent技術等技術,已廣泛應用在現(xiàn)代數(shù)字圖書館建設中,并發(fā)揮了良好的推動作用。信息化智慧導讀前景