<code id="y0inx"></code>

<font id="y0inx"><noscript id="y0inx"><var id="y0inx"></var></noscript></font>
<b id="y0inx"><form id="y0inx"><del id="y0inx"></del></form></b>
    <video id="y0inx"></video>

<video id="y0inx"><ins id="y0inx"><option id="y0inx"></option></ins></video>
      <font id="y0inx"><noscript id="y0inx"><var id="y0inx"></var></noscript></font>

        <cite id="y0inx"><form id="y0inx"></form></cite>

        1. <u id="y0inx"><noscript id="y0inx"></noscript></u><video id="y0inx"><nav id="y0inx"><em id="y0inx"></em></nav></video>
          <b id="y0inx"></b>
          <font id="y0inx"><form id="y0inx"></form></font>

          易菇網-食用菌產業門戶網站
          省級分站
          分類網
        2. 裝袋機
        3. 當前位置: 首頁 » 技術 » 蕈菌文獻 » 正文

          中文食用菌文獻數據庫建庫實踐與反思


          【發布日期】:2010-09-15

            江洪濤 陸振清 俞美蓮 謝坤生 呂惠琳 (上海市農科院情報所 201106)
            陳麗佩 (上海市農科院食用菌所 201106)
            摘 要:利用電子計算機進行中文信息管理,建立了中文食用菌數據庫。該數據庫能從主題詞、分類號、作者、篇名、刊名及年卷期等多種途徑進行檢索,并且該庫內的數據能轉為ISO 2709格式,具有良好的數據共享性。該數據庫帶有較詳細的中文文摘,且檢索速度極快。該庫的建立,使食用菌信息管理朝現代化方面跨出了一大步。食用菌學是一門古老而又新興的學科,涉及化學、微生物學、農業、林業、食品、土壤和氣象諸學科,因此文獻分布較分散,手工檢索較困難,而且效率低下。我國是食用菌生產大國,上海是我國主要生產研究基地之一,上海農科院食用菌所是國內最早成立的該專業研究所,上海農科院情報所的館藏特色之一是食用菌文獻。因此建立《中文食用菌文獻數據庫》具有可行性、實用性和科學性。
            關鍵詞:食用菌 中文文獻
            1 本庫特色
            (1) 近幾年來,我國建立了一系列專業數據庫和文獻庫,但大都是題錄型。雖然建庫前處理工作和輸入工作量減少了,但由于題錄所提供的信息有限,用戶須一一查找原文以確定文獻的內容,因而影響了數據庫的實用性。眾所周知,數據庫的建庫目的為節省用戶時間,提高查全率和查準率,何況本庫的用戶對象為科研人員、農業基層單位和專業戶,而農業基層單位和專業戶不可能也沒必要擁有豐富的文獻資源作為文獻保障的基礎,因此本庫以文摘型為主的特色一可節約用戶時間,二可適應基層單位和專業戶的需要,三是本所擁有文獻和技術的優勢,具有可行性和實用性。
            (2) 由于情報專業文獻數據庫的數據量大,檢索要求高,而且其字段內容不似數值數據庫那么等長,這就需要有一種適合作為情報文獻數據的支持軟件。MICROC-CDS/ISIS是由聯合國教科文組織提供的、經中國科技情報研究所漢化的通用情報檢索軟件。由該軟件支持建立起來的文獻數據庫最大容量可16MB,并且字段可變長,它的每個字段長度可在1~1650范圍中自由選取,最大限度壓縮了存儲空間,達到數據庫冗余量極小的目的,這對于應用有限內外存空間的微機建立一個容量大、字段字符數不等長的情報專業文獻數據庫是十分重要的。該軟件還具有可在同一檢索文件中進行多字段(包括重復字段)檢索的特點,因而只須打開這唯一的檢索文件,就可方便地進行檢索,故其檢索速度特別快。MICRO C-CDS/ISIS系統進行時,要求漢字操作系統的配置中,文件數(FILES)和緩沖區數(BUFFERS)均≥20,建中文食用菌文獻數據庫配置的MSDOS為3.3,中文操作系統為2.13H。
            2 建庫實踐
            2.1 建庫思想
            中文食用菌文獻數據庫是為科研人員和專業戶提供文獻資料的現代化服務方式,科學性和實用性是質量的保證,所謂科學性:一是指本系統技術的可靠性,二是指文獻來源的真實性。所謂實用性包括兩個方面:一是內容上要符合用戶的需要,二是方法上盡可能簡便易用。本庫重點在于文摘,使用戶檢索后基本上滿足了其信息需求。
            2.2 數據前處理
            數據的前處理工作包括文獻收集、篩選、著錄工作單、標引等。該工作的質量直接影響了整個數據庫的檢索效率,它既是建庫的基礎,又是主要工作。
            2.2.1 數據收集標準
            數據的質和量是建庫的關鍵,本庫收集標準為:全而精,所謂全是指保證用戶在利用本庫后基本上不須再利用其他檢索工具,所謂精是指文獻來源的可靠性。為保證文獻的質和量,我們采用定性分析(專家評估,讀者調查)和定量分析(引文法,相對%法,Bradford法)相結合的方法,綜合分析了150多種我國食用菌專業期刊和相關期刊,重點收集前十位的核心期刊的文獻(見附表一),約占國內有關食用菌文獻的80%以上。
            2.2.2 工作單設計
            工作單是人工采集數據與計算機處理的接口,它的設計涉及到庫結構的設計,實際上是檢索途徑和顯示內容的總設計,因此必須慎重。本工作單設計有13項內容,其中包括6個檢索途徑,適用于中外文圖書,期刊,資料(見附表二)。
            2.2.3 文獻標引
            文獻標引是前處理工作中的重中之重。在篩選數據之后,標引質量就決定了整個庫的質量,它直接影響到查全率和查準率。因此必須由學有專長的高級職稱人員擔任,必須熟悉食用菌專業并具有標引實踐經驗
            2.2.3.1 主題標引
            主題標引包括敘詞法 關鍵詞法、單元詞法和標題法。其特點是:直觀性、專指性、適應性、集中性、多元性??紤]到《漢語主題詞表》中有關食用菌方面的內容過于簡單,而當時《農業主題詞表》尚未出版,我們采用了半受控自由詞標引,主題詞采用國家標準(GB1272891),其特點是簡便、直觀易于用戶掌握。但標引時須注意:
           ?、?嚴格采用標準術語。例如:文獻中和人們日常生產習慣用“菌絲”一詞,與“菌絲體”不分,實際上,“菌絲”與“菌絲體”是有區別的。“菌絲”是指由孢子萌發后形成的芽管發展而成,它以頂端生長并分枝而為管狀多細胞組成的絲狀物,而“菌絲體”則為菌絲的集合體。在大多文獻中,多指菌絲的集合體,而文獻的標題或文獻內容中多數寫為“菌絲”,這時,如標引為“菌絲”就不夠準確,應按食用菌標準名詞術語來標引為“菌絲體”。
           ?、?慎用元詞。例如:“培育”,“融合”、“遺傳”等。元詞使用較靈活,但對復雜的詞須組配才能得到,用起來較麻煩,且有些概念組配后易搞錯。例如:“培養基質”是指培養物賴以生存的各種物質。如以“培養”、“基質”標引,實際上已失去“培養”的概念。如果需查“培養”,“培養基質”也會檢出,造成誤檢。此時應按標題法標引,應標為“培養基質”。
           ?、?如專指詞能精確表達文獻內容,一般就不使用泛指詞。例:雙孢蘑菇泡囊病的診治標引詞:蘑菇;雙孢蘑菇;泡囊??;真菌??;診斷;防治蘑菇是雙孢蘑菇的上位概念,用“蘑菇”可以對雙孢蘑菇的文獻進行擴檢,對最上位概念“食用菌”就不必標引了。“泡囊病”直接上位概念是“真菌病”,專指程度已較高,與標引詞“蘑菇”一樣,不必標引再上位概念。
           ?、?慎用和少用通用概念詞標引。如對一般通用概念主題詞也一一標上,會導致影響泛指性文獻的檢索,又增加了標引及輸入的勞力,還浪費了計算機的存貯空間,減慢檢索效率。本數據庫是專業文獻庫,泛指文獻較少,故“影響”、“方法”等一類通用概念基本不標(除綜述性文獻之外)。
           ?、?自由詞標引。自由詞標引以關鍵詞為基礎,我們標引時先標題內關鍵詞,當題內關鍵詞不夠標時再選題外關鍵詞。雖然是關鍵詞,我們也絕不能隨便“自由”標引,因為計算機不能識別同義詞書寫不同型的詞,如“玉米”與“苞米”、“COLOR”與“COLOUR”,檢索詞與標引詞稍有不同,計算機就不能識別,就會造成誤檢與漏檢。我們在標引自由詞時采取了十分慎重的態度,盡量使文獻標引一致,提高查全率查準率。
           ?、?以食用菌標準名詞術語為基礎,加上一些自由詞,從而逐步形成本數據庫實際使用的主題詞表,并逐步充實完整。及時提供用戶使用。
            2.2.3.2 分類標引
            分類法是我國傳統的揭示文獻內容的標引方法,在組織書本式目錄,推薦同類文獻、驗證查全率和查準率等方面都具有獨特的優勢,因此至今仍不失為重要的檢索途徑。本庫分類標引是在《中國圖書資料分類法》(第三版)的基礎上,對S646和S567.3類目作一些擴展,調整編制成“食用菌、藥用菌專業分類表(見附表三)其編制原則為:首先按真菌的科學分類為基礎,然后再按文獻出現頻率排列,即科學性和實用性相結合、這樣既克服了《中圖法》某些類目設置不科學,某些類目過于簡單,使得無類可歸或有類難歸,又盡可能與《中圖法》接軌,也適應專業性很強的食用菌文獻分類。為了類分某一主題,某一方面的文獻,充分揭示文獻內容,我們按食用菌生產的過程(制種、栽培、病蟲害防治、采收加工)編制了“食用菌、藥用菌專業復分表”(見附表四)。實踐證明:以上兩表基本上滿足了建庫的要求。
            2.3 MICRO CCDS/ISIS軟件的二次開發
            首先確立庫結構格式(SJWX·FDT)考慮到本庫服務對象的特點,還有微機本身內外存空間較小的因素,庫結構的設計也應簡潔、明了,我們定義了11個字段(見附表五),分別為:篇名、作者、譯者、刊名、分類號、年卷期、所在頁碼、館藏號、文獻代碼、主題詞、摘要。根據該軟件允許重復字段和子字段定義的特點,為方便用戶利用,我們設計了作者字段和主題詞字段為重復字段。其次設計屏幕格式文件(SJWX·FMT)與工作單相對應。再次選擇了倒排字段表(SJWX·SFT)(見附表六)。通過選擇,用戶可通過6個途徑進行檢索(主題詞、分類號、作者、篇名、刊名及年卷期)。最后建立顯示、打印格式文件(SJWX·PFT)為:MFN……/V2“/”V4,“∥”V6,“·”V8∧a,V8∧b,“(”V8∧c“)”,“·”V9,/“館藏號”V10/“文獻代碼”V11/“分類號”V7/“摘要”V31/“主題詞”(自由詞)V21/%#。其中,“MFN”是機內號;“Vn”表示字段標資代碼;“/”表示換行。按以上顯示,打印輸出格式文件,顯示或打印的結果是:
            篇名/作者∥刊名·年卷(期)·所在頁碼
            館藏號
            文獻代碼
            分類號
            摘要
            主題詞(自由詞)
            利用MICRO CCDS/ISIS軟件建立上述4個文件后,則建立了本庫的框架,即可進行數據輸入,修改、檢索、顯示等工作。但由于本庫的容量較大,而C盤中系統文件較多,如果數據文件再存放于C盤中,則顯得外存空間較擁擠,所以我們在建庫時將數據庫文件設置在虛擬盤(D盤)中,操作員仍然在C盤中工作,而相應數據在D盤里,由于系統文件與數據文件分別在二個硬盤里,故系統比較容易找到自己建立起來的文件,不易引起二種文件的混淆不清。
            另外,我們對該軟件中所包含的文件進行了調整和調度,把ISIS的可執行文件和系統參數文件歸入SYS目錄中,這樣,系統在運行時可在子目錄中搜尋所需文件而不設路徑,從而提高了運行速度,減少了空間的使用。
            3 經驗與反思
           ?。?) 本數據庫的建立和使用,成功地二次開發MICRO C-CDS/ISIS軟件,利用電子計算機進行中文信息處理,具備了維護、修正、刪除、添加、排序、檢索、瀏覽、顯示、打印等功能。由于該數據庫帶有較詳細的文摘,故實用性較強,節約了科技人員的時間,減輕了科研人員的勞動強度。該數據庫冗余量小,數據量大,檢索速度較快。庫內數據能轉為ISO2709標準格式,具有良好的數據共享性。
           ?。?) 該數據庫收集了國內有關食用菌專業期刊、微生物類期刊、農業(設有生物專業的綜合性大學)院校學報、農業學報等學報類中有關食用菌專業的文獻。該數據庫能從主題詞、分類號、作者、篇名、刊名及年卷(期)等多種途徑進行單項或多項檢索;通過運用布爾算式,用精確詞或右截斷詞進檢索。例如檢索有關金針菇的文獻,只需打開檢索文件,鍵入“金針菇”,1s左右,屏幕即顯示出命中文獻篇數,再撳〈D〉(顯示功能)鍵,則逐屏逐篇顯示有關金針菇的文獻;如鍵入“金針菇×栽培”,1s左右,屏幕即顯示出金針菇栽培方面的文獻和篇數,縮小了命中范圍,提高了檢索查準率。同樣,按入〈D〉鍵,屏幕即逐篇顯示出有關金針菇栽培的文獻。其它方面查詢如同以上檢索。各種查詢方式一般均可在1~2s時間內獲得結果。該數據庫還可在限定字段中檢索。
           ?。?) 該數據庫采用主題標引和分類標引,既直觀明了,又能體現學科的系統和完整性。
           ?。?) 本數據庫的建立和使用,可為食用菌技術的開發及研究方向的確立提供依據,有利于食用菌科研與開發事業的發展,具有較大的社會效益和經濟效益。
           ?。?) 本庫由于建庫時間短、人員少、經費緊張,因而存在著一些遺憾:
           ?、?MICRO CCDS/ISIS軟件檢索方便但排序功能差,不便于編制書本式目錄,在目前計算機尚未普及的國情下,不利于廣大老少邊窮地區用戶使用;
           ?、?工作單設計應盡可能與其他數據庫靠攏,分類號應和主題詞項目一齊放在最后,這樣一方面便于輸入,另一方面有利于標引文獻時互相借鑒,核對;
           ?、?分類號字段也應設計為重復字段,這樣有利于分析分類文獻;
           ?、?數據收集應注重質量,借鑒國內外數據庫經驗,采用高薪聘請專業人員撰寫文摘,并建立一系列審核制度,把差錯消滅在輸入之前。
            參考文獻
            [1]劉波.病蟲資料數據庫結構建立的研究.計算機農業應用,1990、2:13~15
            [2]陳睿.情報管理系統軟件開發工具.情報學報,1991、10、(1):34~40
            [3]王枚.標引深度的定量分析.情報學報,1993、10、(1):41~48
            [4]中國科技情報所計算機室.MICRO CCDS/ISIS用戶手冊.中國科技情報研究所, 1989:23~78
            PRACTICE AND INTROSPECTION OF DATABASE OF
            CHINESE EDIBLE FUNGI LITERATURE
            Jiang Hongtao Lu Zhengqing Yu Meilian Xie Kunshen
            Lu Huilin
            (Scientific and Technical Information Research Institute,Shanghai
            Academy of Agricultural Sciences, Shanghai 201106)
            Chen Lipei
            (Edible Fungi Research Institute, Shanghai
            Academy of Agricultural Sciences, Shanghai 201106)
            ABSTRACT: Science and technology is developing quickly. Information work must follow this situation. We use computer to handle Chinese information. The database of Chinese Edible Fungi literature was set up. It can execute retrieval from subject words, classification number, author, title, source journal, year, volume, issue. The data in the database can return to ISO 2709 format.
            KEY WORDS: computer, edible fungi, Chinese literature, database


           
           
          [ 技術搜索 ]  [ 加入收藏 ]  [ 告訴好友 ]  [ 打印本文 ]  [ 違規舉報 ]  [ 關閉窗口 ]

           
          0相關評論

           
          推薦圖文
          推薦技術
          點擊排行
          網站首頁  |  關于本站  |  發展歷程  |  顧問團隊  |  會員入會  |  招聘信息  |  收款方式  |  聯系我們  |  隱私政策  |  使用協議  |  信息規范  |  網站地圖  |  排名推廣  |  廣告服務  |  網站留言  |  RSS訂閱  |  違規舉報  |  鄂ICP備20002293號-6
           
          亚洲精品动漫在线线观看人_变态另类专区av无码_99热这里只有精品mp4_在线中文字幕精品第二十