引 言
網(wǎng)絡(luò)經(jīng)濟(jì)與信息技術(shù)的發(fā)展,使得高校圖書館的服務(wù)空間日益擴(kuò)大,個(gè)性化服務(wù)也逐漸成為新型服務(wù)模式的主流。根據(jù)數(shù)字圖書館個(gè)性化信息服務(wù)發(fā)展的需要,在已有的數(shù)字資源優(yōu)勢(shì)和個(gè)性化技術(shù)優(yōu)勢(shì)的基礎(chǔ)上,本論文研究并構(gòu)建了“基于Agent的個(gè)性化信息推送服務(wù)子系統(tǒng)”。該子系統(tǒng)是“圖書館專家知識(shí)交換系統(tǒng)”的一個(gè)重要組成部分,它是依托知識(shí)資源系統(tǒng),利用相關(guān)技術(shù)建立起來的一個(gè)標(biāo)準(zhǔn)化的知識(shí)服務(wù)系統(tǒng)平臺(tái),可以為用戶提供不同層次、多種類型的服務(wù)。
一、 信息推送及其相關(guān)技術(shù)
1、個(gè)性化服務(wù)
面對(duì)網(wǎng)絡(luò)信息服務(wù)的現(xiàn)狀,人們?cè)趯で笠环N將用戶感興趣的信息主動(dòng)推送給用戶的服務(wù)方式,也就是個(gè)性化的信息推送服務(wù)。[1]個(gè)性化服務(wù)是一種能夠滿足用戶個(gè)體需求的服務(wù)方式,當(dāng)前很多領(lǐng)域都提出了個(gè)性化服務(wù)的概念,例如新聞網(wǎng)站、資源推送系統(tǒng)、信息檢索系統(tǒng)等。在數(shù)字圖書館領(lǐng)域中,也需要研究用戶的行為和習(xí)慣,對(duì)不同的用戶采取不同的服務(wù)策略,從而使其信息需求得到最大程度的滿足。目前對(duì)個(gè)性化服務(wù)的研究主要集中在信息檢索、推送技術(shù)等具體的實(shí)現(xiàn)技術(shù)上。個(gè)性化服務(wù)的質(zhì)量取決于具體的推送技術(shù)、檢索技術(shù)以及系統(tǒng)了解用戶興趣的程度。因此,構(gòu)建個(gè)性化的信息推送系統(tǒng)是整個(gè)數(shù)字圖書館個(gè)性化服務(wù)的關(guān)鍵。
2、信息推送技術(shù)
傳統(tǒng)的信息檢索方式是一種拉取模式(即PULL模式),必須由用戶主動(dòng)檢索才會(huì)輸出相應(yīng)的結(jié)果。但是隨著網(wǎng)絡(luò)信息容量的急劇膨脹,單純的信息拉取技術(shù)并不能保證用戶及時(shí)、準(zhǔn)確地獲取網(wǎng)絡(luò)信息資源,缺乏一種有效、智能的信息服務(wù)和檢索機(jī)制來保證用戶方便、準(zhǔn)確的獲取所需的信息。人們?cè)诰W(wǎng)絡(luò)上搜索信息時(shí),主要存在兩個(gè)方面的困難:信息過載和信息迷向。為了解決上述問題,信息推送技術(shù)就應(yīng)運(yùn)而生了。[2]所謂信息推送(又稱PUSH)就是網(wǎng)絡(luò)公司通過一定的技術(shù)標(biāo)準(zhǔn)或協(xié)議,從網(wǎng)上的信息源或信息制作商那里獲取信息,通過固定的頻道向用戶發(fā)送信息的新型的信息傳播系統(tǒng)。推送模式是一種廣播的模式,它以頻道廣播的方式使網(wǎng)上的用戶被動(dòng)、有目的地接受需要的信息。
3、結(jié)合Agent的智能信息推送
我們將Agent技術(shù)應(yīng)用于個(gè)性化信息推送服務(wù)之中的原因是基于Agent自身的特點(diǎn)。[3]Agent的自主性、反應(yīng)性、主動(dòng)性、社會(huì)性及其他屬性為個(gè)性化信息服務(wù)的實(shí)現(xiàn)提供了可能。推送技術(shù)中最關(guān)鍵,也是首先要解決的問題是對(duì)信息的分類及處理。而目前我們面對(duì)的信息特點(diǎn)是:信息量巨大,信息類型難以估計(jì)和難以人工處理,如何使用機(jī)器進(jìn)行自動(dòng)處理。針對(duì)上述問題,要使推送技術(shù)最終得以成功應(yīng)用,本論文對(duì)結(jié)合了Agent的信息推送服務(wù)系統(tǒng)進(jìn)行了研究。推送技術(shù)的一個(gè)發(fā)展方向就是在目前的推送技術(shù)基礎(chǔ)上融入人工智能、知識(shí)發(fā)現(xiàn)技術(shù)、Internet及數(shù)據(jù)庫技術(shù),從而形成智能信息推送技術(shù),這樣可以從根本上解決推送技術(shù)應(yīng)用推廣過程中所遇到的難題。
二、 基于Agent的個(gè)性化信息推送服務(wù)系統(tǒng)的總體設(shè)計(jì)
1、系統(tǒng)功能設(shè)計(jì)
構(gòu)建個(gè)性化信息推送服務(wù)平臺(tái)的目的就是要改變傳統(tǒng)圖書館的被動(dòng)服務(wù)方式,實(shí)行主動(dòng)向用戶推送館藏各種資源的服務(wù)方式。本系統(tǒng)的主要功能是能夠根據(jù)用戶興趣偏好而主動(dòng)地向用戶推送書籍或論文資料。用戶可以瀏覽資源的基本信息,查閱其借閱情況,并可直接閱讀全文;同時(shí)可以對(duì)歷史的推送資源進(jìn)行組織和管理。除此之外,為了體現(xiàn)本系統(tǒng)的智能化和人性化特性,我們將Agent等人工智能方面的技術(shù)引入,使得系統(tǒng)不僅能根據(jù)用戶提交的一些特性提供有針對(duì)性的信息,而且能對(duì)用戶的興趣進(jìn)行動(dòng)態(tài)跟蹤與智能分析,從而主動(dòng)地向用戶推送其可能需要的信息。
2、系統(tǒng)總體結(jié)構(gòu)
Yahoo …… Google 信息檢索Agent 信息過濾Agent 用戶接口Agent 用戶 用戶反饋Agent 用戶 Profile
圖1 基于Agent的個(gè)性化信息推送服務(wù)系統(tǒng)模型
在上圖中可以看到,負(fù)責(zé)用戶和系統(tǒng)進(jìn)行交互的模塊是用戶接口Agent。系統(tǒng)首先將用戶提交的一些個(gè)人需求信息保存到用戶Profile中,然后根據(jù)用戶的個(gè)性化需求,通過信息檢索Agent從信息源檢索得到一批信息資源,最后經(jīng)過過濾之后推送給用戶。其中,用戶反饋Agent是負(fù)責(zé)定期將用戶的反饋信息提交給用戶Profile,以不斷修改用戶的個(gè)性化需求服務(wù)的模型。
3、推送服務(wù)的實(shí)現(xiàn)方式
信息推送的實(shí)現(xiàn)方式主要有兩種:基于Internet的信息推送、基于數(shù)據(jù)庫系統(tǒng)的信息推送。[4]基于Internet的信息推送主要有以下幾種:(1)頻道式推送:這是目前普遍采用的一種模式,它將某些頁面定義為瀏覽器的頻道,用戶可以像選擇電視頻道那樣接收感興趣的信息。(2)郵件式推送:用電子郵件方式主動(dòng)將所推送信息發(fā)布給各用戶。(3)網(wǎng)頁式推送:在一個(gè)特定網(wǎng)頁內(nèi)將所推送的信息提供給用戶。(4)專用式推送:采用專門的信息發(fā)送和接受軟件,信源將信息推送給專門用戶。由于考慮到信息推送的實(shí)時(shí)性以及適用范圍的普遍性,本系統(tǒng)將采用網(wǎng)頁式推送和郵件式推送結(jié)合的推送服務(wù)方式。
三、 基于Agent的個(gè)性化信息推送服務(wù)系統(tǒng)的主要模塊設(shè)計(jì)
1、用戶接口Agent
用戶接口Agent為用戶與個(gè)性化信息推送服務(wù)系統(tǒng)的交互提供了一個(gè)接口,用戶通過該接口Agent進(jìn)行注冊(cè)、登陸系統(tǒng)、查看系統(tǒng)推送給用戶的信息資源。在本模塊中,最主要的功能是進(jìn)行用戶興趣的學(xué)習(xí)。因此,用戶興趣建模是用戶接口Agent實(shí)現(xiàn)的重要組成部分,也是整個(gè)個(gè)性化信息推送服務(wù)實(shí)現(xiàn)的關(guān)鍵。我們首先通過對(duì)用戶注冊(cè)信息的分析,建立初始的用戶興趣模型;然后在用戶反饋Agent模塊中對(duì)其不斷調(diào)整、改進(jìn),使之更加符合用戶的需求。
2、用戶反饋Agent
本系統(tǒng)中考慮采用兩種Agent的反饋學(xué)習(xí)方法:用戶行為跟蹤學(xué)習(xí)方法和相關(guān)反饋學(xué)習(xí)方法。用戶行為跟蹤學(xué)習(xí)的特點(diǎn)是不需要用戶的直接參與,而通過自主地跟蹤用戶的行為,了解用戶的喜好與需求,調(diào)整用戶興趣模型。用戶相關(guān)反饋學(xué)習(xí)與用戶行為跟蹤學(xué)習(xí)的不同之處在于需要用戶的直接參與,通過對(duì)用戶提供的相關(guān)反饋信息的學(xué)習(xí),改進(jìn)用戶興趣模型。
用戶反饋Agent結(jié)合使用以上兩種反饋學(xué)習(xí)方法,定期地對(duì)用戶檢索、瀏覽等行為的日志及用戶提供的相關(guān)反饋信息進(jìn)行分析,不斷地調(diào)整用戶興趣模型。用戶興趣建模的流程如下圖所示:
基本信息 用戶興趣 興趣建模 用戶個(gè)性化表 日志 模式挖掘 注冊(cè) 反饋 行為跟蹤
圖 2 用戶興趣建模
在用戶興趣建模的過程中包含兩個(gè)重要的組成部分:根據(jù)用戶的基本信息而建立用戶興趣模型,以及依據(jù)用戶的興趣反饋和用戶行為跟蹤而進(jìn)行模式挖掘。這兩個(gè)部分都涉及到用戶個(gè)性化表的構(gòu)建與修改。
3、信息檢索Agent和信息過濾Agent
信息檢索Agent利用現(xiàn)有的搜索引擎技術(shù),根據(jù)用戶提交的查詢關(guān)鍵字,在數(shù)據(jù)源中查找用戶感興趣的相關(guān)信息,得到一系列文檔集。信息過濾Agent根據(jù)用戶個(gè)性化表中的用戶興趣模型,對(duì)信息檢索Agent的搜索結(jié)果進(jìn)行再加工和過濾,去除其中和用戶興趣不相關(guān)的或相關(guān)性不大的信息,最終實(shí)現(xiàn)個(gè)性化信息推送服務(wù)。
信息過濾可以分為基于內(nèi)容的過濾和協(xié)同過濾兩種。基于內(nèi)容的過濾通過計(jì)算檢索到的文檔與用戶興趣之間的相似度,得到文檔與用戶興趣的相關(guān)程度,將相似度超過一定閾值的文檔推送給用戶,過濾掉信息檢索Agent中檢索到的文檔中的一些無關(guān)信息,使過濾后的文檔信息更貼近于用戶的需求。協(xié)同過濾又叫做社會(huì)過濾,它分析用戶興趣,在用戶群中找到指定用戶的相似(興趣)用戶,綜合這些相似用戶對(duì)某一信息的評(píng)價(jià),形成系統(tǒng)對(duì)該指定用戶對(duì)此信息的喜好程度的預(yù)測(cè)。
在本系統(tǒng)中,考慮采用基于內(nèi)容的過濾為主,協(xié)同過濾為輔的策略。基于內(nèi)容的過濾是信息過濾的主要實(shí)現(xiàn)形式,也是個(gè)性化信息服務(wù)實(shí)現(xiàn)的關(guān)鍵一步。在信息過濾的過程中,首先使用向量空間模型將用戶興趣以及得到的文檔表示為向量形式,然后計(jì)算兩者的相似度,將相似度最大的前N篇文檔推送給用戶。其具體流程如下圖:
結(jié)束語
本論文在現(xiàn)有信息推送技術(shù)的基礎(chǔ)上融入Agent技術(shù),并結(jié)合知識(shí)發(fā)現(xiàn)、Internet及數(shù)據(jù)庫等技術(shù),構(gòu)建了基于Agent的個(gè)性化信息推送服務(wù)系統(tǒng)。該子系統(tǒng)作為“圖書館專家知識(shí)交換系統(tǒng)”的一個(gè)組成部分,為用戶提供了一個(gè)個(gè)性化信息服務(wù)平臺(tái),擴(kuò)大了現(xiàn)代數(shù)字圖書館的服務(wù)空間。
對(duì)文檔預(yù)處理后, 用向量空間法表示 根據(jù)用戶提交的關(guān)鍵字搜索并返回一批文檔 計(jì)算該文檔向量和用戶profile之間的相似度 是否大于某閾值 將該文檔提交給用戶 丟 棄 否 是
圖 3 信息過濾流程
參考文獻(xiàn)
[1]宋麗哲等.數(shù)字圖書館個(gè)性化服務(wù)用戶模型研究[J].北京理工大學(xué)學(xué)報(bào).2005年01期
[2]吳劍霞.信息推送技術(shù)的原理及在圖書館的應(yīng)用[J].科技情報(bào)開發(fā)與經(jīng)濟(jì).2004年03期
[3]徐俊萍.基于Agent的個(gè)性化信息服務(wù)實(shí)現(xiàn)技術(shù)及其應(yīng)用研究.東南大學(xué)碩士學(xué)位論文
[4]彭國莉.信息推送技術(shù)與信息推送服務(wù)[J].中國信息導(dǎo)報(bào).2001年08期
[5]國家數(shù)字圖書館參考咨詢臺(tái)[EB/OL]. http://dref.csdl.ac.cn/,2003
[6]袁麗芬等.基于XML的信息推送服務(wù)及實(shí)現(xiàn)[J].情報(bào)科學(xué).2003年06期
[7]沈鈞等.“推送”和“拉取”模式的圖書館網(wǎng)絡(luò)信息服務(wù)[J].現(xiàn)代圖書情報(bào)技術(shù). 2002年05期
[8]張延國.基于搜索引擎的個(gè)性化知識(shí)推送系統(tǒng)[J].中國信息導(dǎo)報(bào).2004年06期
[9]Manfred Hauswirth. A Component and Communication Model for Push Systems. Springer-Verlag GmbH. May 2003
[10]Chen-Tung Chen. An information push-delivery system design for personal information service on the Internet. Information Processing and Management. July 2002