
【計】 inverted file
close down; collapse; converse; fall; inverse; move backward; pour; reverse
arrange; eject; exclude; line; platoon; raft; range; rank; row; tier
【化】 blower
document; documentation; file; paper; writ
【計】 file
【醫】 document
【經】 documents; file; instrument
在漢英詞典視角下,“倒排文件”(Inverted File)是信息檢索領域的核心數據結構。其本質是通過建立“詞項→文檔”的映射關系,實現高效文本檢索,與傳統“文檔→詞項”的正排結構相反。
術語對照
來源:計算機術語雙語詞典(科學出版社)
工作機制
倒排文件由兩部分構成:
實現邏輯參考:Elasticsearch官方文檔
倒排索引可形式化定義為:
$$ mathcal{I}(t) = { (di, f{t,d_i}, [p_1, p_2, ...]) mid t in d_i } $$
其中:
全文搜索引擎
Apache Lucene 使用倒排索引實現毫秒級文本檢索,支持布爾查詢、短語查詢等複雜操作。
數據庫優化
如PostgreSQL的GIN索引(Generalized Inverted Index) 加速JSON、數組等數據類型的查詢。
生物信息學
基因序列檢索中采用類似結構處理DNA堿基模式匹配,見NCBI研究論文。
優勢 | 挑戰 |
---|---|
O(1)時間複雜度詞項定位 | 索引構建耗時 |
高效布爾運算(AND/OR) | 存儲空間開銷較大 |
支持短語/近鄰查詢 | 動态更新成本高 |
該結構由IBM的Hans Peter Luhn于1957年首次提出,現代優化方案如Roaring Bitmaps(位圖壓縮)可減少40%存儲空間。
倒排文件(Inverted File)是一種基于屬性值或次關鍵字建立的索引結構,主要用于快速檢索和複雜查詢。以下從定義、結構、優缺點和應用場景四個方面詳細解釋:
倒排文件通過将非主屬性(次關鍵字)作為索引鍵,記錄包含該屬性值的文檔或數據位置。例如,在數據庫中,它允許通過作者、關鍵詞等非主鍵字段快速定位記錄()。其本質是通過屬性值反向映射到數據記錄,因此稱為“倒排”。
若文件存儲圖書信息(主鍵為ISBN,次關鍵字為作者),倒排文件中的作者索引會映射到所有該作者的ISBN列表。查詢“作者=張三”時,直接通過倒排表獲取對應的ISBN集合,無需掃描全表。
如需更完整的定義或技術細節,可參考來源網頁(如、)。
暗點訊號保險現金解約值吡哆酸超道德的锉台多開帳款多路轉換門二烯合成二月桂胺反射減弱非氮性的非均相膜電極封銷覆蓋定義隔夜狗筋曼酣飲混合冷卻法假膜性小腸結腸炎間質性心肌炎結腸直腸炎街道塵土計算機自學糧袋麻仁?難熔化合物葡萄糖酸内酯設備選擇器勝敗脫氧糖胺