中的字符串操作
中,字符串是一种常见的数据类型。字符串可以进行各种操作,如拼接、切片、替换等。下面是一些常用的字符串操作
1.字符串拼接使用“+”符号将两个字符串拼接在一起。
2.字符串切片使用“[ ]”符号获取字符串的一部分。例如,s[03]表示获取字符串s的前三个字符。
3.字符串替换使用replace()方法将字符串中的某个字符或子串替换为另一个字符或子串。
中的集合操作
中,集合是一种无序的、不重复的数据类型。集合可以进行各种操作,如并集、交集、差集等。下面是一些常用的集合操作
1.并集使用“|”符号获取两个集合的并集。
2.交集使用“&”符号获取两个集合的交集。
3.差集使用“-”符号获取两个集合的差集。
三、查找相同的词语
中,可以使用字符串操作和集合操作来查找相同的词语。具体步骤如下
中,并将它们转换为字符串。
2.使用字符串操作,将两个字符串分别处理成单词列表。
3.使用集合操作,将两个单词列表转换为集合。
4.使用集合操作,获取两个集合的交集。
5.输出交集中的词语。
下面是一个示例代码
读入两个文本(‘text1.txt’, ‘r’) as f1
text1 = f1.read()(‘text2.txt’, ‘r’) as f2
text2 = f2.read()
将文本转换为单词列表
words1 = text1.split()
words2 = text2.split()
将单词列表转换为集合
set1 = set(words1)
set2 = set(words2)
获取两个集合的交集tersect = set1 & set2
输出交集中的词语tersectt(w)
的强大功能和简单易学的语法,使得它成为文本分析领域中的重要工具。