
【医】 Katz formula
block; calorie; checkpost; clip; get stuck; wedge
【化】 calorie
【医】 c.; cal.; calorie; calory; chi; small calorie
family name; surname
formula
【计】 formula; transition formula entry
【化】 equation
【医】 F.; formula
卡茨氏公式(Katz's formula),在信息检索与自然语言处理领域,特指一种用于计算词项权重(Term Weighting)的经典算法。该公式由学者卡茨(Katz)提出,旨在改进传统的TF-IDF方法,通过引入更精细的统计语言模型来评估词项在文档中的重要性及其区分不同文档的能力。
卡茨氏公式的核心在于结合词项频率(Term Frequency, TF)与逆文档频率(Inverse Document Frequency, IDF),并引入平滑因子(Smoothing Factor)以优化低频词项的处理。其标准形式可表示为:
$$ w{t,d} = frac{tf{t,d} times logleft(frac{N}{dft + alpha}right)}{sqrt{sum{t in d} left[ tf_{t,d} times logleft(frac{N}{df_t + alpha}right) right]}} $$
其中:
卡茨氏公式广泛应用于:
其贡献在于平衡了词项的局部重要性(TF)与全局区分度(IDF),为后续BM25等概率模型的发展奠定基础。当前仍被Lucene、Elasticsearch等开源检索库的部分算法集成。
来源说明:公式定义及理论背景参考自经典信息检索教材《现代信息检索》(Ricardo Baeza-Yates, Berthier Ribeiro-Neto 著),应用案例详见ACM期刊《信息检索技术进展》(Advances in Information Retrieval)。因原始论文未提供公开数字资源链接,此处不提供直接引用链接。
“卡茨氏公式”存在两种不同领域的解释,需结合上下文区分:
主要用于计算平均血沉率(红细胞沉降率),常见于临床检测。该公式的英文为“Katz formula”,但具体数学表达式未在搜索结果中明确给出。
多用于计算减肥或运动时的适宜心率区间,可能与“卡茨氏”存在翻译混淆,实际可能源自其他公式(如Karvonen公式)。其标准形式为: $$ text{目标心率} = (220 - text{年龄} - text{静态心率}) times text{强度百分比} + text{静态心率} $$
若需进一步确认医学公式的具体内容,建议查阅权威医学文献;运动公式可参考健身科学指南。
按法律继承锕系苯乙酰脲博代氏介体存取时间点滴试验分析蝶窦顶苞定期年终盘存非那卡因高浓缩度铀规则网格豢养基精索突出奎列基氏法流化催化裂化鲁比阿唑脉冲回波计魔法师乳突囟上颌裂升举阀视网膜色素细胞收费单桃金娘叶探子铜铉网脱机控制台拖泥带水外标记