标签:python pandas if-statement match
我的目标是让熊猫等同于以下R代码:
df1$String_1_check = ifelse(df1$String_1 == df2[match(df1$String_2, df2$String_2), 1], TRUE, FALSE)
如果df1列String_1的第n行中的值等于df2的第一列,其中df1的列String_2的第n行与df2的String_2匹配,则在新列String_1_check中为True,否则在String_1_check中为False.
df1在String_1和String_2中有许多相同值的实例,而df2在String_1中只有每个可能值的一个实例. String_3不是唯一的.使用这些示例数据帧:
df1 = pd.DataFrame({'String_1': ['string 1', 'string 1', 'string 2', 'string 3', 'string 1'], 'String_2': ['string a', 'string a', 'string b', 'string a', 'string c']})
df2 = pd.DataFrame({'String_3': ['string 1', 'string 2', 'string 3'], 'String_2': ['string a', 'string b', 'string c']})
String_1 String_2
0 string 1 string a
1 string 1 string a
2 string 2 string b
3 string 3 string a
4 string 1 string c
String_3 String_2
0 string 1 string a
1 string 2 string b
2 string 3 string c
期望的输出是:
String_1 String_2 String_1_check
0 string 1 string a True
1 string 1 string a True
2 string 2 string b True
3 string 3 string a False
4 string 1 string c False
我试过np.where,isin,pd.match(现在已弃用),但还没有找到解决方案.
解决方法:
您可以使用地图而无需更改原始df的顺序
df1['String_1_check']=list(zip(df1['String_1'],df1['String_2']))
df2.index=list(zip(df2['String_3'],df2['String_2']))
df2['Check']=True
df1['String_1_check']=df1['String_1_check'].map(df2['Check']).fillna(False)
Out[764]:
String_1 String_2 String_1_check
0 string 1 string a True
1 string 1 string a True
2 string 2 string b True
3 string 3 string a False
4 string 1 string c False
标签:python,pandas,if-statement,match 来源: https://codeday.me/bug/20190724/1522580.html
本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享; 2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关; 3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关; 4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除; 5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。