
【計】 separating control character
分隔控制字符(Separator Control Characters)是Unicode和ASCII字符集中用于劃分或組織數據結構的非打印控制符。在漢英詞典視角下,其核心含義解析如下:
分隔控制字符
指在數據傳輸或存儲中,用于劃分數據單元邊界或控制格式的特殊控制字符。這類字符本身不可見,但通過預定義功能實現數據分段(如文本塊分隔、表格字段分隔),屬于控制字符的子類。
來源:Unicode标準第16章(控制字符分類)
Separator Control Characters
A subset of control characters in ASCII/Unicode that delimit hierarchical data structures. Key types include:
來源:ISO/IEC 6429标準(信息技術-控制功能)
字符 | Unicode碼點 | 功能描述 | 典型應用場景 |
---|---|---|---|
單元分隔符 (US) | U+001F | 分隔最小數據單元(如字段) | 數據庫字段劃分 |
記錄分隔符 (RS) | U+001E | 分隔邏輯記錄(如數據行) | CSV文件行終止 |
組分隔符 (GS) | U+001D | 分隔數據組(如表格行組) | 分層數據結構存儲 |
文件分隔符 (FS) | U+001C | 分隔完整文件或數據集 | 多文件流傳輸控制 |
Unicode标準定義
分隔控制字符屬于"Cc"(Control)類别,位于Unicode基本多文種平面(U+0000至U+001F)。其功能繼承自ASCII控制符,但擴展支持多語言環境的分隔邏輯。
來源:Unicode Consortium官方文檔
與定界符(Delimiter)的區别
分隔控制符通過二進制指令實現結構化切分,而定界符(如逗號、分號)是可見字符,依賴語法規則解析:
來源:ECMA-48标準(控制功能規範)
定義控制字符的分類原則及分隔符的語義框架。
原始規範中US/RS/GS/FS的功能描述(第4.1節)。
注:因平台限制無法添加外鍊,請通過Unicode官網(unicode.org)或IETF RFC數據庫檢索相關文檔編號。
分隔控制字符可以從兩個概念進行解釋:
指ASCII表中0-31(0x00-0x1F)的不可見字符,用于設備控制而非文本顯示。例如:
這些字符通過控制指令實現數據傳輸、設備交互等功能,常見于早期通信協議和文本格式控制。
指用于劃分數據邊界的可見符號,例如:
特性 | 控制字符 | 分隔符 |
---|---|---|
可見性 | 不可見 | 可見 |
功能 | 設備控制 | 數據邏輯分割 |
示例 | NUL、ETX、ACK | , ; / |
應用場景 | 通信協議、文本格式控制 | 編程語法、文件格式 |
注:極少數情況下,控制字符如TAB(0x09)可能同時承擔分隔功能(如文本列對齊),但本質上仍屬于控制指令。
埃倫邁厄氏合劑報文鑒别變容二極管裁縫的差壓液面計成盲電極夾具堆疊指标對帳表二元同步傳輸分件皮帶輪幹燥奈瑟氏菌高頻電弧熔接機冠周片行動莽撞的核紡錘體夾壁漏鬥醬色交錯布置痙攣性脊髓痨刻面來世論老鴉椒鹵化钌内外科的潘科斯特氏綜合征商業理論私人文件夾瓦生氏瓦生吸蟲為囤積居奇者所蒙混