问题
pandas的pd.read_csv函数,quoting = 3是什么意思?
新建一个test.txt文件,内容如下:哈哈
haha
"haha"
"哈哈"
"ha
ha"
"哈
哈"
import pandas as pd
t = pd.read_csv('test.txt', header=None, sep='\t')
print(t)
输出结果:可以看到英文引号不见了,双引号只会打印引号内的内容,只有单引号的内容打印异常
再改动test.txt代码:import pandas as pd
t = pd.read_csv('test.txt', header=None, sep='\t', quoting = 3)
print(t)
代码输出结果:可以看到所有内容如实打印
结论
不设置quoting,默认会去除英文双引号,只留下英文双引号内的内容,设置quoting = 3,会如实读取内容。