比如偶想把表y1的列str1的出现第3个action的子串替换成dble,怎么实现?
1.自己写SQL层的存储函数。代码如下写死了3个,没有优化,仅仅作为演示,MySQL里非常不建议写这样的函数。
- mysql
- DELIMITER$$
- USE`ytt`$$
- DROPFUNCTIONIFEXISTS`func_instr_simple_ytt`$$
- CREATEDEFINER=`root`@`localhost`FUNCTION`func_instr_simple_ytt`(
- f_strVARCHAR(1000),–Parameter1
- f_substrVARCHAR(100),–Parameter2
- f_replace_strvarchar(100),
- f_timesint–timescounter.onlysupport3.
- )RETURNSvarchar(1000)
- BEGIN
- declarev_resultvarchar(1000)default’ytt’;–result.
- declarev_substr_lenintdefault0;–searchstringlength.
- setf_times=3;–onlysupport3.
- setv_substr_len=length(f_substr);
- selectinstr(f_str,f_substr)into@p1;–Firstrealposition.
- selectinstr(substr(f_str,@p1+v_substr_len),f_substr)into@p2;Secondaryvirtualposition.
- selectinstr(substr(f_str,@p2+@p1+2*v_substr_len-1),f_substr)into@p3;–Thirdvirtualposition.
- if@p1>0&&@p2>0&&@p3>0then–Fine.
- select
- concat(substr(f_str,1,@p1+@p2+@p3+(f_times-1)*v_substr_len-f_times)
- ,f_replace_str,
- substr(f_str,@p1+@p2+@p3+f_times*v_substr_len-2))intov_result;
- else
- setv_result=f_str;–Neverchanged.
- endif;
- –Purgeallsessionvariables.
- set@p1=null;
- set@p2=null;
- set@p3=null;
- returnv_result;
- end;
- $$
- DELIMITER;
- –调用函数来更新:
- mysql>updatey1setstr1=func_instr_simple_ytt(str1,’action’,’dble’,3);
- QueryOK,20rowsaffected(0.12sec)
- Rowsmatched:20Changed:20Warnings:0
- 2.导出来用sed之类的工具替换掉在导入,步骤如下:(推荐使用)1)导出表y1的记录。
- mysqlmysql>select*fromy1intooutfile’/var/lib/mysql-files/y1.csv’;QueryOK,20rowsaffected(0.00sec)
2)用sed替换导出来的数据。- shellroot@ytt-Aspire-V5-471G:/var/lib/mysql-files#sed-i’s/action/dble/3’y1.csv
3)再次导入处理好的数据,完成。- mysql
- mysql>truncatey1;
- QueryOK,0rowsaffected(0.99sec)
- mysql>loaddatainfile’/var/lib/mysql-files/y1.csv’intotabley1;
- QueryOK,20rowsaffected(0.14sec)
- Records:20Deleted:0Skipped:0Warnings:0
- 以上两种还是推荐导出来处理好了再重新导入,性能来的高些,而且还不用自己费劲写函数代码。那MySQL8.0对于以上的场景实现就非常简单了,一个函数就搞定了。
- mysqlmysql>updatey1setstr1=regexp_replace(str1,’action’,’dble’,1,3);QueryOK,20rowsaffected(0.13sec)Rowsmatched:20Changed:20Warnings:0
还有一个regexp_instr也非常有用,特别是这种特指出现第几次的场景。比如定义SESSION变量@a。- mysqlmysql>set@a=’aabbcceefilucy111bs234523556119101020301040′;QueryOK,0rowsaffected(0.04sec)
拿到至少两次的数字出现的第二次子串的位置。- mysqlmysql>selectregexp_instr(@a,'[:digit:]{2,}’,1,2);+————————————–+|regexp_instr(@a,'[:digit:]{2,}’,1,2)|+————————————–+|50|+————————————–+1rowinset(0.00sec)
那大家在看看对多字节字符支持如何。- mysql
- mysql>set@a=’中国美国俄罗斯日本中国北京上海深圳广州北京上海武汉东莞北京青岛北京’;
- QueryOK,0rowsaffected(0.00sec)
- mysql>selectregexp_instr(@a,’北京’,1,1);
- +——————————-+
- regexp_instr(@a,’北京’,1,1)
- +——————————-+
- 17
- +——————————-+
- 1rowinset(0.00sec)
- mysql>selectregexp_instr(@a,’北京’,1,2);
- +——————————-+
- regexp_instr(@a,’北京’,1,2)
- +——————————-+
- 29
- +——————————-+
- 1rowinset(0.00sec)
- mysql>selectregexp_instr(@a,’北京’,1,3);
- +——————————-+
- regexp_instr(@a,’北京’,1,3)
- +——————————-+
- 41
- +——————————-+
- 1rowinset(0.00sec)
- 那总结下,这里偶提到了MySQL8.0的两个最有用的正则匹配函数regexp_replace和regexp_instr。针对以前类似的场景算是有一个完美的解决方案。