
【计】 inverted file
close down; collapse; converse; fall; inverse; move backward; pour; reverse
arrange; eject; exclude; line; platoon; raft; range; rank; row; tier
【化】 blower
document; documentation; file; paper; writ
【计】 file
【医】 document
【经】 documents; file; instrument
在汉英词典视角下,“倒排文件”(Inverted File)是信息检索领域的核心数据结构。其本质是通过建立“词项→文档”的映射关系,实现高效文本检索,与传统“文档→词项”的正排结构相反。
术语对照
来源:计算机术语双语词典(科学出版社)
工作机制
倒排文件由两部分构成:
实现逻辑参考:Elasticsearch官方文档
倒排索引可形式化定义为:
$$ mathcal{I}(t) = { (di, f{t,d_i}, [p_1, p_2, ...]) mid t in d_i } $$
其中:
全文搜索引擎
Apache Lucene 使用倒排索引实现毫秒级文本检索,支持布尔查询、短语查询等复杂操作。
数据库优化
如PostgreSQL的GIN索引(Generalized Inverted Index) 加速JSON、数组等数据类型的查询。
生物信息学
基因序列检索中采用类似结构处理DNA碱基模式匹配,见NCBI研究论文。
优势 | 挑战 |
---|---|
O(1)时间复杂度词项定位 | 索引构建耗时 |
高效布尔运算(AND/OR) | 存储空间开销较大 |
支持短语/近邻查询 | 动态更新成本高 |
该结构由IBM的Hans Peter Luhn于1957年首次提出,现代优化方案如Roaring Bitmaps(位图压缩)可减少40%存储空间。
倒排文件(Inverted File)是一种基于属性值或次关键字建立的索引结构,主要用于快速检索和复杂查询。以下从定义、结构、优缺点和应用场景四个方面详细解释:
倒排文件通过将非主属性(次关键字)作为索引键,记录包含该属性值的文档或数据位置。例如,在数据库中,它允许通过作者、关键词等非主键字段快速定位记录()。其本质是通过属性值反向映射到数据记录,因此称为“倒排”。
若文件存储图书信息(主键为ISBN,次关键字为作者),倒排文件中的作者索引会映射到所有该作者的ISBN列表。查询“作者=张三”时,直接通过倒排表获取对应的ISBN集合,无需扫描全表。
如需更完整的定义或技术细节,可参考来源网页(如、)。
催汗的单细胞腺附加项盖革计数管膈运动波过失误差鼓室隐窝隙合作效应间断的役权结核类脂质记载生物学距离试验具体表现颗粒状脂变的灵长类硫化镧六指免除一切税捐密契尔氏液强制解决潜溶剂前庭被覆层社会主义全民所有制史密斯氏现象税收参收价格说明性宏指令塔裙痛觉过敏带统计平衡头皮钳