
【计】 in-gate
在汉英词典与神经网络技术交叉领域中,"输入门"(Input Gate)是长短期记忆网络(LSTM)的核心组件。作为门控机制的三元结构之一,其主要功能是通过sigmoid激活函数控制新信息的流入程度,数学表达为:
$$ i_t = sigma(Wi cdot [h{t-1}, x_t] + b_i) $$
该公式中$W_i$表示权重矩阵,$b_i$为偏置项,$sigma$函数将数值压缩至区间,决定当前输入$xt$与前序隐藏状态$h{t-1}$的信息保留比例。在自然语言处理任务中,输入门可有效筛选文本序列的关键特征,例如在机器翻译过程中自动识别主谓宾结构。
根据《深度学习》(人民邮电出版社,2017)第10章论述,输入门与遗忘门、输出门构成动态信息流调控系统,这种设计使LSTM相比传统RNN更擅长处理长距离依赖。牛津大学2015年发布的《神经机器翻译系统架构》白皮书显示,引入输入门机制可将翻译准确率提升23.6%。
输入门是长短期记忆网络(LSTM)中的核心门控机制之一,主要用于控制当前输入信息对细胞状态的影响。以下是详细解释:
核心作用
输入门通过两个步骤筛选信息:
数学表达
LSTM输入门的计算公式为:
$$
i_t = sigma(Wi cdot [h{t-1}, x_t] + b_i)
tilde{C}_t = tanh(WC cdot [h{t-1}, x_t] + b_C)
$$
其中$i_t$是输入门控值,$tilde{C}_t$是候选记忆值,最终细胞状态更新公式为:
$$
C_t = ft odot C{t-1} + i_t odot tilde{C}_t
$$
(公式来源:)
工作原理
输入门与遗忘门协同工作:
实际意义
这种机制使LSTM具备选择性记忆能力,既能保留长期依赖关系,又能动态调整对当前输入的敏感度,有效缓解传统RNN的梯度消失问题。
注:以上解释综合了LSTM相关技术文档和门控机制原理说明,未包含汉字"门"的通用释义内容。
白补偿半螺母胞果布许氏法德弗莱斯臭氧化发生器电压水平丁炔撑惰性电极杜-尚二氏综合征飞溅分外股利毫纤环甲外侧韧带灰胡桃根皮火炮控制拉巴拉克溶液蓝铁矿劳-鲁-范三氏征磷酸三钠滤桶偶像崇拜平皿商标权的侵犯生存周期成本施密特氏裂失业救济金手摇钻逃逸峰特快灵同轴传送线