将 input.txt 以 iso 的格式解码并以utf8的格式输出
iconv -f ISO-8859-1 -t UTF-8 < input.txt > output.txt
将文件中的制表符分割转换成逗号
cat tab_delimited.txt | tr " " "," comma_delimited.csv
将所有的大写字母转化为小写
cat filename.csv | tr '[A-Z]' '[a-z]'
将CSV文件,每500行分割为一个新的文件new_filename
split -l 500 filename.csv new_filename_
# filename.csv
# ls output
# new_filename_aaa
# new_filename_aab
# new_filename_aac
# 这里的-t选项是指定逗号作为分隔符。通常假设是空格或制表符。
# 此外,-k标志是用来指定我们的键的。它的语法是-km,n,m是起始字段,
# n是最后一个字段。
sort -t"," -k2,2
sort -u
等价于 sort file.txt | uniq