
倒向文件
The index storage models of the hybrid index mechanism have three models: tree model, hash index model and inverted file model.
混純索引機造采取的索引亡儲模型從要無樹、哈希和反排文件三類方式。
Based on data-distort method, we propose privacy preserving association rules mining algorithm IFB-PPARM using efficient data structure namely inverted file.
基于數據變換法,提出使用高效數據結構即倒排文件的隱私保護關聯規則挖掘算法ifb - PPARM。
The algorithm only need scan the transaction database once, and all the transaction operations are carried out on the inverted file mapped from transaction database.
算法隻需對事務數據庫做一次掃描,并且所有對事務的處理操作都在事務數據庫映射成的倒排文件中進行。
This paper analyzes Chinese full-text retrieval technologies based on compressed inverted file, including data compression, file storage, searching and ranking mechanisms.
探讨基于壓縮倒排文件的中文全文檢索技術,包括數據壓縮方法、存儲、檢索與排名機制。
This paper analyzes data retrieval of XML currently, and proposes a kind of path index technology which have been combined with inverted file to implement retrieval both on context and structure.
該文分析了當前對XML數據檢索的相關工作,提出了一種路徑索引技術,并将之無縫結合了基于文本的倒排索引文檔,以實現XML文檔的内容和結構的雙重檢索。
"inverted file"(倒排文件/倒置文件)是計算機科學中的專業術語,主要用于信息檢索領域。以下是綜合多個來源的解釋:
"inverted file" 是一種以關鍵詞為索引核心的數據結構,其本質是通過屬性值反向定位原始記錄的索引機制。與傳統的正向索引(通過記錄找屬性)不同,倒排文件通過屬性值(如單詞、特征描述符)快速查找包含該屬性的所有記錄地址。
詞彙表(索引項) 存儲所有唯一的關鍵詞或屬性值,例如文檔中的單詞或圖像特征描述符。
事件表(文件鍊表) 記錄每個關鍵詞對應的所有文檔或數據條目ID,可能包含出現位置、頻率等元數據。
在中文中常譯為倒排文件(更常見)或倒置文件,英語對應術語為 inverted index(倒排索引)。其核心思想與"反向虹吸"(inverted siphon)等物理概念中的"倒置"含義一緻。
倒排文件通過空間換時間提高檢索效率,但需額外維護索引更新。現代系統常結合壓縮技術(如Roaring Bitmaps)優化存儲。
倒排文件是信息檢索中常用的一種數據結構。它是一種索引方式,用于存儲文檔中的詞彙信息。在倒排文件中,每個單詞都有一個對應的文檔列表,文檔列表中包含了包含該單詞的所有文檔的信息。
倒排文件常用于搜索引擎中,以便快速檢索相關文檔。它也可以用于文本分析和數據挖掘中,以便識别文檔中的關鍵詞和主題。
倒排文件包含兩個主要部分:詞彙表和倒排索引。詞彙表是所有單詞的列表,而倒排索引則包含每個單詞的文檔列表。文檔列表中包含文檔的唯一标識符,以及單詞在文檔中出現的次數和位置信息。
倒排文件的優點是它可以快速找到包含特定單詞的文檔,并且可以通過組合多個單詞來縮小搜索範圍,以便找到相關文檔。
【别人正在浏覽】