这篇文章给大家分享的是有关Python如何判断两个文件是否相同与两个文本进行相同项筛选的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。
python判断两个文件是否相同
import hashlib
def getHash(f):
line=f.readline()
hash=hashlib.md5()
while(line):
hash.update(line)
line=f.readline()
return hash.hexdigest()
def IsHashEqual(f1,f2):
str1=getHash(f1)
str2=getHash(f2)
return str1==str2
if __name__ == '__main__':
f1=open("D:/2.iso","rb")
f2=open("E:/wenjian/1.iso","rb")
print IsHashEqual(f1,f2)
计算2个文件的MD5值,大文件计算较慢
python对两个文本进行相同项筛选
import os
import os.path as osp
def filter(path):
file_path = osp.join(path, 'index.txt')
if osp.exists(file_path):
return file_path
index_file = open(file_path, 'a+')
if not os.path.isdir(path): #判断path是否为路径
return
for root, dirs, list in os.walk(path):
for i in list:
dir = os.path.join(root, i) #将分离的部分组成一个路径名
#if os.path.getsize(dir) < 60000: #获取文件大小
#os.remove(dir) #删除文件
print (i)
index_file.write(i+'\n')
index_file.close()
def compare(path):
file=osp.join(path, 'label.txt')
file_path = osp.join(path, 'index.txt')
with open(file_path, 'r') as file1:
with open(file, 'r') as file2:
same = set(file1).intersection(file2)
same.discard('\n')
with open('some_output_file.txt', 'w') as file_out:
for line in same:
file_out.write(line)
file_out.close()
filter(r'D:\Desktop\jiaoben\ci')
compare(r'D:\Desktop\jiaoben\ci')
1、简单易用,与C/C++、Java、C# 等传统语言相比,Python对代码格式的要求没有那么严格;2、Python属于开源的,所有人都可以看到源代码,并且可以被移植在许多平台上使用;3、Python面向对象,能够支持面向过程编程,也支持面向对象编程;4、Python是一种解释性语言,Python写的程序不需要编译成二进制代码,可以直接从源代码运行程序;5、Python功能强大,拥有的模块众多,基本能够实现所有的常见功能。
感谢各位的阅读!关于“Python如何判断两个文件是否相同与两个文本进行相同项筛选”这篇文章就分享到这里了,希望以上内容可以对大家有一定的帮助,让大家可以学到更多知识,如果觉得文章不错,可以把它分享出去让更多的人看到吧!
亿速云「云服务器」,即开即用、新一代英特尔至强铂金CPU、三副本存储NVMe SSD云盘,价格低至29元/月。点击查看>>
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。