虽然可以用python、R写脚本,但喜欢上bash不拘小节的风格。可以将各种命令行的程序看作bash内置的命令,黏合在一起,真正做到pipeline。而且bash本身的一些命令工具,如wc、grep、awk、sed等,小巧、方便,是python等无法达到的。总之,bash很适合大数据处理。
1. 系统配置
.bashrc
.bash_profile # R语言中是.Rprofile
2. X11 (X-window)
X11: xming, Cygwin/xwin
VNC: fastx
3. 文件管理系统
|
|
4. 输入输出
|
|
5. 重定向与管道命令
|
|
6. $() ${}Command substitution
|
|
7. 变量$与数组()
|
|
8. 字符串
字符串被看成一种特殊数组,所有字符串的处理都通过${}进行($’\n’是换行符)
9. 函数
|
|
10. 控制语句
分支:
循环:
|
|
|
|
|
|
|
|
11. 查看文本head/tail, cat/more/less, hexdump
|
|
12. 处理文本grep/sed/awk
|
|
13. 多线程/并行&, xargs, parallel
|
|