匹配汉字或者数字 正则

strinfo=re.compile(r'([\u4e00-\u9fa5]|[\d])')
df['label']=df['data'].apply(lambda x:strinfo.sub('',x))


strip_=re.compile(r'([,]|[。]|[:]|[、])')
括号里面的符号不需要再加引号了

 
 

 

转载于:https://www.cnblogs.com/jfdwd/p/11458331.html

最新回复(0)
/jishuki6HVGqM_2B5nJDha_2BS7zFqUkfWeeRJcQYDdaWG_2FmZg_2F0_3D4794782
8 简首页