我想将.CSV文件导入MySQL表.我想根据CSV文件中包含的实际数据确定要使用的最佳列宽.是否有任何脚本或实用程序来完成此任务?
解决方法:
如果可能,最好避免尝试猜测适当的列长度 – 如果您可以获取CSV的来源以更详细地指定预期的格式(列X将包含不超过Y个字符),那么尝试一下.
我建议最初使用长可变长度类型 – 这可能比更多约束类型效率更低但是如果某些字段比预期更大,则会确保您不会在以后的导入中出错(或者更糟糕的是,由于mysql默默地截断某些字段而无法丢失数据).在这种情况下,MSSQL文本字段需要是nvarchar(max)或varchar(max),除非它们需要成为索引的一部分,在这种情况下它们需要更多约束(没有索引可以超过900) MSSQL下的数据字节).除非你能从源头获得更多数据格式,这是最安全的方式,当然你可以使用一些猜测(例如,包含国家保险号的字段不应超过11个字符,但是小心,因为字段可能被错误地命名为nad /或重载以存储除了其名称之外的其他内容.
如果你真的别无选择,只能猜测并且使用较大的类型对你来说效率太低,那么为了帮助guestimating过程将你所拥有的文件导入到一个表中,其中所有字段都是最大长度可变文本类型,然后执行一些粗鲁的分析例如SELECT MAX(LEN(< field1>)),MAX(LEN(< field2>))FROM< table>得到基于猜测的指示,对于非字符串字段,您可以使用更复杂的模式匹配来确定预期范围(即字段X始终是ISO格式的数据,字段Y是介于-500和45,123之间的数字,以及小数点后两位,等等.
关于“最优”:虽然使用较大固定长度的较大可变长度类型可能效率较低,但效率和最佳效果并不一定相同:如果您遇到错误或丢失数据,那么效率会很低意外地将类型设置得过于严格.
标签:mysql,import,datatypes 来源: https://codeday.me/bug/20190806/1595095.html
本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享; 2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关; 3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关; 4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除; 5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。