Yaml 文件开头注释是什么意思?
编辑小狼毫的方案及配置项文件时,通常会看到这样文件开头:
# wubi86_double_key.yaml
# vim: set sw=2 sts=2 et:
# encoding: utf-8
schema:
schema_id: wubi86_double_key
name: "五笔86双键版"
....
那么开头的注释有什么含义呢?
第一行详解
第一行比较简单,一般要放文件名,或者其他注释,不要放正式内容。为了防止加了Bom的utf-8文件无法解析。 具体原因见, Rime 輸入方案設計書
鑑於一些文本編輯器會爲 UTF-8 編碼的文件添加 BOM 標記,爲防止誤將該字符混入文中, 莫要從文件的第一行開始正文,而請在該行行首以 # 記號起一行註釋
因为默认的文件存储格式是utf-8,而utf-8又分带bom和不带bom两种格式。 带bom会在开头添加几个字节,方便程序判断一个文本是否为utf-8编码。
如果你是程序员,要编写程序读写utf-8,还可以看看这里的bom详解: UTF8最好不要带BOM,附许多经典评论
第二行详解
正式开始最重要的一行,就是第二行
# vim: set sw=2 sts=2 et:
这是什么意思呢?
这一行有个学名叫modeline,是vim专用的。 用vim打开这个文件时,会自动运行该命令,设置好阅读和编辑该文件的一些参数
命令的具体含义,参看下面的解答
"vim中每个命令都是简写和全拼两种模式,后面列出命令的全拼,大家就知道什么意思了
set sw=2 "sw即shiftwidth,设置自动缩进 2 个空格
set sts=2 "即设置 softtabstop 为 2. 输入 tab 后就跳了 2 格
set et "设置expandtab,即将tab扩展为空格,如果要取消这个选项,为 :set noet
" vim的开头命令,都是在前面加no表取消
命令之间是通过空格或者":"分隔的,最后那个":"起分隔作用,表示设置结束
所以,总结一下就是,编辑yaml文件的具体环境为:
- 自动缩进为2
- tab键缩进相当于2个空格
- 将tab键自动扩展为空格
当然,也可以把上面的命令写在_vimrc中,作为全局设置。 这样,打开编辑其他的,没有带modeline的文件时,也可以使用统一的设置。
更多的vim设置
vim中还有一些其他的缩进相关的设置也列在这里
set tabstop=4 "实际的 tab 即为 4 个空格, 而不是缺省的 8 个
# 设置自动的缩进风格
set ai "设置自动缩进
set cindent "设置使用 C/C++ 语言的自动缩进方式
关于Vim的tabstop,softtabstop的区分,以及与shiftwidth,expandtab组合使用的具体含义。参见下面的帖子
vim中tabstop、shiftwidth、softtabstop以及expandtab的关系
yaml小知识
Yaml简介
首先,yaml的全称 Yaml Ain't Markup Language。即Yaml不是标记语言,这是针对XML而言的,即Yaml中不需要使用标签。 注: Ain't是am not的缩写,后来又变成isn't等否定的缩写
YAML is a human friendly data serialization standard for all programming languages.
官方给的定义是,Yaml是一种可读的数据序列化标准。
简单的讲,就是yaml就是一种描述各种结构化数据的纯文本语言。与它同样地位的,可以相互类比的是xml和json。 关于这三者的比较,可以看这里 序列化格式:XML、JSON、YAML
数据表示方法
Yaml是如何描述数据的结构呢?主要有以下三条:
- Structure通过空格来展示,即通过缩进来表示包含关系,也可以通过[]和{}后面有介绍
- Sequence里的项用"-"来代表
- Map里的键值对用":"分隔.
qwerty:
ascii_mode: 0
author: "osfans <waxaca@163.com>"
height: 55
keys: [{click: q, long_click: "!", swipe_up: 1}, {click: w, long_click: "@", swipe_up: 2}, {click: e, long_click: "#", swipe_up: 3}, {click: r, long_click: "$", swipe_up: 4}, {click: t, long_click: "%", swipe_up: 5}, {click: y, long_click: "^", swipe_up: 6}, {click: u, long_click: "&", swipe_up: 7}, {click: i, long_click: "*", swipe_up: 8}, {click: o, long_click: "(", swipe_up: 9}, {click: p, long_click: ")", swipe_up: 0}, {width: 5}, {click: a, long_click: select_all, swipe_down: Down, swipe_left: Left, swipe_right: Right, swipe_up: Up}, {click: s, long_click: "~", swipe_down: Page_Down, swipe_left: Home, swipe_right: End, swipe_up: Page_Up}, {click: d, long_click: "-", swipe_down: _}, {click: f, long_click: "+", swipe_down: "="}, {click: g, long_click: "\\", swipe_down: "|"}, {click: h, long_click: "[]", swipe_left: "[", swipe_right: "]"}, {click: j, long_click: "{}", swipe_left: "{", swipe_right: "}"}, {click: k, long_click: ":"}, {click: l, long_click: ";"}, {width: 5}, {click: Shift_L, composing: "'", send_bindings: true, width: 15}, {click: z, long_click: "`"}, {click: x, long_click: cut}, {click: c, long_click: copy}, {click: v, long_click: paste}, {click: b, long_click: Time, swipe_up: Date}, {click: n, long_click: "\""}, {click: m, long_click: "'"}, {click: BackSpace, width: 15}, {click: Mode_switch, long_click: Menu, width: 15}, {click: Keyboard_symbols, long_click: Keyboard_number}, {click: ",", long_click: "<", paging: Page_Up}, {click: space, width: 30}, {click: ., has_menu: Page_Down, long_click: ">"}, {click: "/", long_click: "?"}, {click: Return, long_click: CommitComment, width: 15}]
上面的文件定义了一个名叫qwerty的映射,这个映射包含几个个字段:
- ascii_mode
- author
- height
- keys : 这是一个复合类型,其中包含了多个按键,每个按键,又包含多个属性值
每个字段的取值,在冒号后面指定。 其中keys是一个复合字段,它本身又是一个列表,它包含多个键值。另外,每个键值,又是一个字典(又叫映射),包含多个属性值对。
列表和字典的区别在于,列表是有序的,而字典是无序的。上面的keys要表示键盘每个键的排列,所以必须是有序的排列。 而每个key的属性值,只是标明各个属性,并不需要有序。
上面为了简洁,上面的keys以单行模式写出,如果展开会是
qwerty:
keys:
- {click: q, long_click: "!", swipe_up: 1}
- {click: w, long_click: "@", swipe_up: 2}
...
进一步展开会变成:
qwerty:
keys:
-
click: q
long_click: "!"
swipe_up: 1
-
click: w
long_click: "@"
swipe_up: 2
从上面,我们可以看出列表和映射的两种表示方法:
列表的单行与展开模式:
#单行模式:
name: [value1, value2]
#展开模式:
name:
- value1
- value2
映射的单行与展开模式:
#单行模式:
name: {p1: n1, p2: n2}
#展开模式:
name:
p1: n1
p2: n2
数据引用方式
打patch时,需要先取得准备修改的属性,然后才能对其进行修改。
参见晓群老师,给我的示例,
"preset_keyboards/qwerty/keys/@31": {label: "英", click: Keyboard_default}
总结如下:
映射数据的引用:
"/"一层一层的引用
列表数据的引用:
通过@<下標>
引用 。
patch:
"一級設定項/二級設定項/三級設定項": 新的設定值
"另一個設定項": 新的設定值
"再一個設定項": 新的設定值
"含列表的設定項/@0": 列表第一個元素新的設定值
"含列表的設定項/@last": 列表最後一個元素新的設定值
"含列表的設定項/@before 0": 在列表第一個元素之前插入新的設定值(不建議在補靪中使用)
"含列表的設定項/@after last": 在列表最後一個元素之後插入新的設定值(不建議在補靪中使用)
"含列表的設定項/@next": 在列表最後一個元素之後插入新的設定值(不建議在補靪中使用)
打补丁注意事项
打补丁,相当于对某个数据域重新进行赋值。该数据域如果是一个映射,那么它原始值中未被赋值的属性就会被删除。 所以,要精确引用到需要进行修改的数据域很重要。 如果引用的数据范围过大,而又没有给其中的所有属性赋值,布署时,程序由于读不到某些关键的属性,就会崩哦。
比如,现在需要定制输入方案,切换到英文模式时,调用标准的qwerty键盘。但是需要对qwerty键盘打补丁,对其中的某些项作修改。
#对键高度,和某个按键的事件,以及中/英模式,做补丁修改
#方法1,OK,可以正常工作,精确指定了修改的属性
"preset_keyboards/qwerty/height": 60
"preset_keyboards/qwerty/keys/@31": {label: "英", click: Keyboard_default}
"preset_keyboards/qwerty/ascii_mode": 1
#方法2,用全覆盖的方式定制
"preset_keyboards/qwerty": #注意这里,相当于对整个qwerty重新赋值
height: 60 #每行的高度
keys: #这里必须重新把所有要使用的按键都声明一遍
- {click: space}
ascii_mode: 1
#注:用这种方式定制时,相当于对整个qwerty赋值,不能只赋值其中的一部分,而是要全部赋值。否则,未出现的属性值,会被删除
其他
另外,网上还有数据引用和合并的介绍,但是我还没有验证,在我们程序中是否可行。
可以使用&符号定义一个引用标签,使用符号*引用这个标签的数据,使用符号<<进行hash值合并操作,例如:
# sequencer protocols for Laser eye surgery
---
- step: &id001 # defines anchor label &id001
instrument: Lasik 2000
pulseEnergy: 5.4
pulseDuration: 12
repetition: 1000
spotSize: 1mm
- step:
<<: *id001 # merges key:value pairs defined in step1 anchor
spotSize: 2mm # overrides "spotSize" key's value
- step:
<<: *id001 # merges key:value pairs defined in step1 anchor
pulseEnergy: 500.0 # overrides key
alert: > # adds additional key
warn patient of
audible pop
- &id001定义了一个id001的引用标签(引用文档中第一个step元素的所有属性);
- 第二个step元素引用id001后,重写spotSize属性;
- 第三个step元素引用id001后,重写pulseEnergy属性,并添加alert属性