文件转码

将 input.txt 以 iso 的格式解码并以utf8的格式输出

iconv -f ISO-8859-1 -t UTF-8 < input.txt > output.txt

TR命令

将文件中的制表符分割转换成逗号

cat tab_delimited.txt | tr "	" "," comma_delimited.csv

将所有的大写字母转化为小写

cat filename.csv | tr '[A-Z]' '[a-z]'

Split

将CSV文件,每500行分割为一个新的文件new_filename

split -l 500 filename.csv new_filename_

# filename.csv
# ls output
# new_filename_aaa
# new_filename_aab
# new_filename_aac

Sort & Uniq

# 这里的-t选项是指定逗号作为分隔符。通常假设是空格或制表符。
# 此外,-k标志是用来指定我们的键的。它的语法是-km,n,m是起始字段,
# n是最后一个字段。
sort -t"," -k2,2

sort -u 等价于 sort file.txt | uniq