午夜剧场伦理_日本一道高清_国产又黄又硬_91黄色网战_女同久久另类69精品国产_妹妹的朋友在线

您的位置:首頁(yè)技術(shù)文章
文章詳情頁(yè)

python通過(guò)re正則表達(dá)式切割中英文的操作

瀏覽:21日期:2022-06-24 16:33:03

我就廢話(huà)不多說(shuō)了,大家還是直接看代碼吧~

import re s = ’alibaba阿里巴巴’ # 待分割字符串en_letter = ’[u0041-u005a|u0061-u007a]+’ # 大小寫(xiě)英文字母zh_char = ’[u4e00-u9fa5]+’ # 中文字符 print(re.findall(zh_char,s) + re.findall(en_letter,s)) # 輸出: [’阿里巴巴’, ’alibaba’] 范圍 說(shuō)明 u4e00-u9fa5 漢字的unicode范圍 u0030-u0039 數(shù)字的unicode范圍 u0041-u005a 大寫(xiě)字母unicode范圍 u0061-u007a 小寫(xiě)字母unicode范圍

補(bǔ)充:python--中英文混合字符串的切分(中文按字?jǐn)嚅_(kāi),英文按單詞分開(kāi),數(shù)字按空格等特殊符號(hào)斷開(kāi))

待切分句子:

s = '12、China’s Legend Holdings will split its several business arms to go public on stock markets, the group’s president Zhu Linan said on Tuesday.該集團(tuán)總裁朱利安周二表示,haha中國(guó)聯(lián)想控股將分拆其多個(gè)業(yè)務(wù)部門(mén)在股市上市,。'

切分結(jié)果:

[’12’, ’china’, ’s’, ’legend’, ’holdings’, ’will’, ’split’, ’its’, ’several’, ’business’, ’arms’, ’to’, ’go’, ’public’, ’on’, ’stock’, ’markets’, ’the’, ’group’, ’s’, ’president’, ’zhu’, ’linan’, ’said’, ’on’, ’tuesday’, ’該’, ’集’, ’團(tuán)’, ’總’, ’裁’, ’朱’, ’利’, ’安’, ’周’, ’二’, ’表’, ’示’, ’haha’, ’中’, ’國(guó)’, ’聯(lián)’, ’想’, ’控’, ’股’, ’將’, ’分’, ’拆’, ’其’, ’多’, ’個(gè)’, ’業(yè)’, ’務(wù)’, ’部’, ’門(mén)’, ’在’, ’股’, ’市’, ’上’, ’市’]

代碼:

import redef get_word_list(s1): # 把句子按字分開(kāi),中文按字分,英文按單詞,數(shù)字按空格 regEx = re.compile(’[W]*’) # 我們可以使用正則表達(dá)式來(lái)切分句子,切分的規(guī)則是除單詞,數(shù)字外的任意字符串 res = re.compile(r'([u4e00-u9fa5])') # [u4e00-u9fa5]中文范圍 p1 = regEx.split(s1.lower()) str1_list = [] for str in p1: if res.split(str) == None: str1_list.append(str) else: ret = res.split(str) for ch in ret:str1_list.append(ch) list_word1 = [w for w in str1_list if len(w.strip()) > 0] # 去掉為空的字符 return list_word1if __name__ == ’__main__’: s = '12、China’s Legend Holdings will split its several business arms to go public on stock markets, the group’s president Zhu Linan said on Tuesday.該集團(tuán)總裁朱利安周二表示,haha中國(guó)聯(lián)想控股將分拆其多個(gè)業(yè)務(wù)部門(mén)在股市上市。' list_word1=get_word_list(s) print(list_word1)

以上為個(gè)人經(jīng)驗(yàn),希望能給大家一個(gè)參考,也希望大家多多支持好吧啦網(wǎng)。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教。

標(biāo)簽: Python 編程
相關(guān)文章:
主站蜘蛛池模板: 欧美一区二区在线视频 | 日一区二区| av福利在线 | 欧美色视频在线观看 | 97福利社 | 日韩区欧美区 | 四虎在线免费观看 | 免费又黄又爽又色的视频 | 日本成人综合 | 激情97| 激情综合五月网 | 日日摸日日添日日躁av | 天天干天天色天天爽 | 久久久999成人 | 国产在线视频一区二区三区 | 国产午夜精品一区二区 | 色综合中文网 | av中文字幕免费在线观看 | 亚洲 欧美 日韩 在线 | 欧美亚洲精品在线 | 成人毛片在线免费观看 | 精品综合 | 黄色亚洲视频 | 一本色道久久综合亚洲精品酒店 | 日韩在线一二三区 | 欧美一区二区三区婷婷月色 | 国产精品久久久久久久妇 | 日韩免费视频一区二区 | 亚洲情热| 久久精品18| 亚洲免费av一区二区 | 国产精品欧美激情 | 国产伊人网 | 免费国产高清 | 美女日日日 | 国产精品成人一区二区 | 国产精品99久久久久久久 | 麻豆久久久久 | 免费欧美一级 | 黑人と日本人の交わりビデオ | 国产色在线视频 |