s.decode('gbk', 'ignore')
比如,若要将某个String对象s从gbk内码转换为UTF-8,可以如下操作
s.decode('gbk').encode('utf-8')
可是,在实际开发中,我发现,这种办法经常会出现异常:
UnicodeDecodeError: ‘gbk’ codec can’t decode bytes in position 30664-30665: illegal multibyte sequence
这是因为遇到了非法字符——尤其是在某些用C/C++编写的程序中,全角空格往往有多种不同的实现方式,比如/xa3/xa0,或者/xa4/x57,这 些字符,看起来都是全角空格,但它们并不是“合法”的全角空格(真正的全角空格是/xa1/xa1),因此在转码的过程中出现了异常。
幸运的是,tiny找到了完美的解决办法(我因此被批评看文档不仔细,汗啊……)
s.decode('gbk', 'ignore').encode('utf-8')
因为decode的函数原型是decode([encoding], [errors=’strict’]),可以用第二个参数控制错误处理的策略,默认的参数就是strict,代表遇到非法字符时抛出异常;
如果设置为ignore,则会忽略非法字符;
如果设置为replace,则会用?取代非法字符;
如果设置为xmlcharrefreplace,则使用XML的字符引用。
这个方法帮助确实 是相当大的哦。对于那种在数据库中存储了全角与半角的非法字符的问题可以这样来进行解决处理的哦!
字符编码问题永远是一个让人头疼的问题哈哈!
2.www.python.org/dev/peps/pep-0249/
上面提供了Python-DBAPI的常用操作功能。
总结出来相关的API操作方法:
3.总结出来Python连接数据库的一般程序过程是这样来写的:
第一步:导入相关的模块
其中MYSQL:
import MySQLdb
其中MSSQL:
import pymssql
第二步:打开连接
其中MYSQL:
conn = MySQLdb.connect(self.dbhost,self.dbuser,self.dbpasswd,self.database)
其中MSSQL:
conn = pymssql.connect(host=self.dbhost,user=self.dbuser,password=self.dbpasswd,database=self.database)
[通过本身的函数原型来定义出来这个方法的]
第三步:连接完了之后就要开始创建一个cursor了。通过这个对象来对数据库发送一个请求操作。
代码:
curs = conn.cursor()
相当于JAVA中的Statement对象一样的。通过语句来进行提交SQL命令的
第四步:开始发送SQL命令到数据库服务器了,可以这样来做
curs.execute(SQL)
例如:
curs.execute("select * from test")
其中的SQL命令可以是任意的SQL语句 可以是执行INSERT 操作或DELETE操作也可以是SELECT操作的
要注意到 执行完了之后要进行commit()提交一次的。
例如:
cursor.execute("insert into test(id) values(1)")
如果是执行了SELECT操作的话就要进行第五步操作了:
第五步:
curs.execute("select * from test")rows = curs.fetchall()
其中的fetchall()只是我们的cursor对象的一个方法而已的。
现在就可以提取出来相关信息了
for i in range(len(rows)): print "Row",i,"name",rows[i][0],"value",rows[i][1]
看我写的代码:
def test(self): conn = self.connect() sql="select * from bbs where id<20" curs = conn.cursor() #得到一个游标对象 curs.execute(sql) #执行一个SQL语句 rows=curs.fetchall() #得到全部的查询结果集 for i in range(len(rows)): # print "Row",i,"name",rows[i][3],"value",rows[i][4] conn.close()
我明白了:通过这样的方法的话 得到的一行记录其实是一个元组的数据结构的。
要取其中的一个可以用一个类似两维数组的方法进行查询出来的。
rows[1][0]:表示第一条记录中的第一个位置的值的。
然后再来看看 将其从数据库中提取出来之后进行编码处理与解码处理
for i in range(len(rows)): print rows[i][4].decode('gb2312', 'ignore').encode('gb2312')
Sqlserver2000连接Oracle11G数据库进行数据实时同步 | Sqlserver2000连接Oracle11G数据库进行数据实时同步 ...
SqlServer2000 类似sqlserver2005的 rownumber() 函数 | SqlServer2000 类似sqlserver2005的 rownumber() 函数 ...