
倒向文件
The index storage models of the hybrid index mechanism have three models: tree model, hash index model and inverted file model.
混纯索引机造采取的索引亡储模型从要无树、哈希和反排文件三类方式。
Based on data-distort method, we propose privacy preserving association rules mining algorithm IFB-PPARM using efficient data structure namely inverted file.
基于数据变换法,提出使用高效数据结构即倒排文件的隐私保护关联规则挖掘算法ifb - PPARM。
The algorithm only need scan the transaction database once, and all the transaction operations are carried out on the inverted file mapped from transaction database.
算法只需对事务数据库做一次扫描,并且所有对事务的处理操作都在事务数据库映射成的倒排文件中进行。
This paper analyzes Chinese full-text retrieval technologies based on compressed inverted file, including data compression, file storage, searching and ranking mechanisms.
探讨基于压缩倒排文件的中文全文检索技术,包括数据压缩方法、存储、检索与排名机制。
This paper analyzes data retrieval of XML currently, and proposes a kind of path index technology which have been combined with inverted file to implement retrieval both on context and structure.
该文分析了当前对XML数据检索的相关工作,提出了一种路径索引技术,并将之无缝结合了基于文本的倒排索引文档,以实现XML文档的内容和结构的双重检索。
"inverted file"(倒排文件/倒置文件)是计算机科学中的专业术语,主要用于信息检索领域。以下是综合多个来源的解释:
"inverted file" 是一种以关键词为索引核心的数据结构,其本质是通过属性值反向定位原始记录的索引机制。与传统的正向索引(通过记录找属性)不同,倒排文件通过属性值(如单词、特征描述符)快速查找包含该属性的所有记录地址。
词汇表(索引项) 存储所有唯一的关键词或属性值,例如文档中的单词或图像特征描述符。
事件表(文件链表) 记录每个关键词对应的所有文档或数据条目ID,可能包含出现位置、频率等元数据。
在中文中常译为倒排文件(更常见)或倒置文件,英语对应术语为 inverted index(倒排索引)。其核心思想与"反向虹吸"(inverted siphon)等物理概念中的"倒置"含义一致。
倒排文件通过空间换时间提高检索效率,但需额外维护索引更新。现代系统常结合压缩技术(如Roaring Bitmaps)优化存储。
倒排文件是信息检索中常用的一种数据结构。它是一种索引方式,用于存储文档中的词汇信息。在倒排文件中,每个单词都有一个对应的文档列表,文档列表中包含了包含该单词的所有文档的信息。
倒排文件常用于搜索引擎中,以便快速检索相关文档。它也可以用于文本分析和数据挖掘中,以便识别文档中的关键词和主题。
倒排文件包含两个主要部分:词汇表和倒排索引。词汇表是所有单词的列表,而倒排索引则包含每个单词的文档列表。文档列表中包含文档的唯一标识符,以及单词在文档中出现的次数和位置信息。
倒排文件的优点是它可以快速找到包含特定单词的文档,并且可以通过组合多个单词来缩小搜索范围,以便找到相关文档。
【别人正在浏览】