公司的数据库一直在用 mysql.4.0.x 的版本,用了几年了,不过现在连 mysql 官方都停止对 4.0.x 版本的支持了,升级看起来是大势所趋。搜索了一些这方面的文章,大家的作法不一,网上的文章也有很多错误的地方。
总结了一下,由于 mysql 4.0.x 的库都是 latin1 编码的,所以主要问题还是出现在编码转换上。
废话少说,下面是经测试可用的转换步骤,测试版本为
mysql4.0.26->mysql5.0.45-community
1.latin1->latin1 原来是 latin1 字符集的数据库,升级后保留 latin1 编码;
个人不推荐这种方式,如果数据库中有包含中文字符的话,还是换成gbk或者utf8编码比较好。
这种方式下,可以直接把 datadir copy 到新的mysql 的data 目录即可,如果数据库中有包含中文,可能用 phpmyadmin 会看不到正常的结果,不用担心,用其它客户端连接的时候,都是可以正常输入和输出的,注意在用 php 连的时候,不需要加 set names xxx 字样;
2.latin1->gbk 原来是 latin1,升级后是 gbk
两种方法:
1) 修改 my.cnf,在 [mysqld] 中加入
default-character-set=gbk
后重启 mysql 服务,然后就可以直接把 datadir copy 过来了,前提是整个库中都是 gbk 编码的库的时候才建议这样,而且copy 过来后,my.cnf中的那行 default-character-set 不能再动了;
2) 手工在新服务器上建立需要的库,字符集选择 gbk,然后在旧服务器上先用 mysqldump 导出为 sql 文件,在导出的 sql 文件的起始位置添加 set names gbk; 在服务器上用以下语句导入:
mysql -u xxx [database] < xxx.sql
这种方式转换后,php 连接数据库后需要先执行 set names gbk;
3.latin1->utf8 原来是 latin1,升级后是 utf8
手工在新服务器上建立需要的库,字符集选择 utf8_bin,然后在旧服务器上先用 mysqldump 导出为 sql 文件,在导出的 sql 文件的起始位置添加 set names gbk; 在服务器上用下面的语句导入:
mysql --default-character-set=utf8 -u xxx [database] < xxx.sql
这种方式转换后,php 连接数据库后需要先执行 set names utf8;
另外有一点要注意的,4.1 版本开始,mysql 的用户密码算法有改变,php5 才支持这种新的验证方式,如果你还是使用 php4,可以在 my.cnf 的 [mysqld] 中多加一句:
old_password = 1
Oracle自带的 EXP 命令,可以很方便的从Oracle库中导出所需要的数据。基本语法可以通过 exp help=y 查看。
今天在使用的时候碰到一个问题,需要导出指定库中的前200条记录,在网上搜索了一下,大部分文章都是这样说的:
exp scott/tiger TABLES=(emp,bonus) QUERY="WHERE job='SALESMAN' and sal<1600"
于是我试着这样做
exp scott/tiger TABLES=(emp,bonus) QUERY="WHERE rownum<201"
实际测试的时候,发现老是报 LRM-00112: multiple values not allowed for parameter 'query' 的错误。再后来发现引号是需要转义的,网上那么多文章都错了……
下面是正确的写法:
windows下的写法:
C:\exp>exp userid=tkyte/tkyte tables=t query="""where object_id < 5000"""
linux下的写法:
$ exp userid=/ tables=t query=\"where object_id \< 5000\"
今天一个偶然的机会中知道 SQL 中的 INSERT 语句还可以这样写:
INSERT INTO tbl_name (col1, col2) VALUES (value1_1, value1_2),(value2_1, value2_2),(value3_1, value3_2)...
这样的写法实际上是类似于
INSERT INTO tbl_name (col1, col2) VALUES (value1_1, value1_2)
INSERT INTO tbl_name (col1, col2) VALUES (value2_1, value2_2)
INSERT INTO tbl_name (col1, col2) VALUES (value3_1, value3_2)
...
如果在执行过程中碰到一个值错误,则这个值以后的数据都不会被插入。
以上语句在 Mysql 4.0 中通过,其它数据库没有测试。
公司需要把数据从 MsSQL 转到 MySQL,转过去的数据始终是不完整的。就像被人从中间故意截断的一样。
先是考虑是 MsSQL 的问题,用它自身的查询分析器查询却没问题。可是用PHP写的脚本来查就有问题。
通知了我们的网管,检查了半天也没有查出来什么问题。后来忽然间就想到了是不是PHP中的限制。打开PHP.ini,仔细找了一下,果然有类似于下面的一段:
[MSSQL]
; Allow or prevent persistent links.
mssql.allow_persistent = On
; Maximum number of persistent links. -1 means no limit.
mssql.max_persistent = -1
; Maximum number of links (persistent+non persistent). -1 means no limit.
mssql.max_links = -1
; Minimum error severity to display.
mssql.min_error_severity = 10
; Minimum message severity to display.
mssql.min_message_severity = 10
; Compatability mode with old versions of PHP 3.0.
mssql.compatability_mode = Off
; Connect timeout
;mssql.connect_timeout = 5
; Query timeout
;mssql.timeout = 60
; Valid range 0 - 2147483647. Default = 4096.
;mssql.textlimit = 4096
; Valid range 0 - 2147483647. Default = 4096.
;mssql.textsize = 4096
; Limits the number of records in each batch. 0 = all records in one batch.
;mssql.batchsize = 0
; Specify how datetime and datetim4 columns are returned
; On => Returns data converted to SQL server settings
; Off => Returns values as YYYY-MM-DD hh:mm:ss
;mssql.datetimeconvert = On
; Use NT authentication when connecting to the server
mssql.secure_connection = Off
; Specify max number of processes. Default = 25
;mssql.max_procs = 25
罪魁祸首我已经在上边用红色标出来了。索性把它改为最大 2147483647,再次查询后,一切正常。
真是寒啊~
如果不是 Babyken 的提醒,这个错误我想我还会一直犯下去。
事情起因,帮 Babyken 做了一个 0day 查询的脚本,脚本很简单,就是简单的取用户输入的值做 LIKE 操作查询数据库。做好后经测试一直运行很好。可是今天 Babyken 告诉我说有个BUG,输入 "___" 或 ".__" 等类似的关键字时,会把数据库中的所有记录都取出来。
偶又试了以前写过的几个应用,寒,都有这个问题。。。
看起来是SQL本身对LIKE的处理问题。问了几个朋友也都没有注意过。后来在Mysql手册上找到答案:
Pattern matching using SQL simple regular expression comparison. Returns 1 (TRUE) or 0 (FALSE). With LIKE you can use the following two wildcard characters in the pattern:
Char Description
% Matches any number of characters, even zero characters
_ Matches exactly one character
当时感觉就是汗啊~~ 以前怎么自己就没有注意过呢?
解决办法是把用户的输入中的 _ 和 % 转义。
不知道是只是Mysql有这个问题,还是其它数据也有。希望熟悉其它数据库应用的朋友试一下。
相关Mysql说明页面:http://www.mysql.com/doc/en/String_comparison_functions.html
2004年1月16日22时25分补记:
与xdanger探讨后发现,目前网上大部分的PHP+Mysql程序都存在此BUG,IPB和PHPBB也不例外,VBB中被过滤掉了。看起来这应该是一个值得引起重视的问题了。
Mysql 不支持子查询,所以在其它数据库中类似于这样的语句
SELECT * FROM [table] WHERE markid IN (SELECT DISTINCT markid FROM [table])
在Mysql中就不好使了。
如果只 DISTINCT 一个字段,可以使用 GROUP BY 的一个特性来解决。
SELECT * FROM table GROUP BY markid
是不是很BT的用法。呵呵。别管怎样,能用就好。^O^
需要注意的是 filed 属性需要为 not null
其实说白了也很简单了,就是直接把Data下的文件Copy到Linux下Mysql相应的数据目录就可以了。注意系统数据库不要Copy。
不过偶今天在做的时候却碰到一些小麻烦。复制过去后,在PHPmyadmin下看的时候只能看到库的数据表列表,详细浏览时却提示某某 .frm 文件不存在。后来折腾了半天,还是因为权限问题。
总结步骤如下:
shell>chown -R mysql.mysql tabledir
shell>chmod -R 660 tabledir
shell>chmod 700 tabledir