文章来源于:https://github.com/gadenbuie/tidyexplain#relational-data
* Mutating Joins — inner_join(), left_join(), right_join(), full_join()
-
Set Operations —
union(),union_all(),intersect(),setdiff() -
Tidy Data —
spread()andgather()dplyr包里的合并函数:
left_join 左合并:保留右侧里与左侧一致的行,增加到新的一列。右侧与左侧不匹配的行会被删除。

full_join 全合并:会根据指定列合并,右侧和左侧不一致的行,都会被保留,作为新的一行,缺失的值会用NA填充。

inner_join:保留合并依据列,左侧和右侧都有的行的数据

anti_join:找出根据指定列,左侧中与右侧不一致的列所对应的行

setdiff:找出左侧和右侧完全匹配行,之外左侧的行

intersect:提取左侧和右侧整行完全一致的行

长短数据的互相转换的过程

长数据变宽数据
spread(longdata,key,val) 参数1:长数据,参数2:key所在的列(即type列),参数3:key或type对应的数值value
宽数据变长数据
gather(wide,key,val,x:z) 参数1:宽数据,参数2:要生成的新的key/type列的名称,参数3:新生成的type列的数值,参数4:指定要合并那些列