在文件上传到服务器的时候,我们希望能够获得文件的指纹以确定文件没有被篡改过。
常用的算法最开始使用的是 MD5,随后随着技术的发展,MD5 算法已经被确定是不安全的了。
目前可能使用更多的是 HSA3_256 哈希算法。
哈希算法通常有以下几个特点:
哈希算法主要有MD4、MD5、SHA。
在 Java 中,可以使用 Apache 提供的 Apache Commons Codec,非常容易的获得文件的哈希字符串指纹。
方法也非常简单,第一步就是需要将文件读取为 InputStream。
如果自己写的话,可能这一步有点代码。
你可以使用 Apache 提供的
FileUtils.openInputStream
就可以直接将文件读取为 InputStream 了。
考察下面的代码:
InputStream is = FileUtils.openInputStream(new File(SCOConstants.PATH_DATA_EXCHANGE + Estimated vs Original Manual (JIRA) 10-23-20.csv));
600px-MD5_algorithm.svg600×659 18.4 KB
在文件读取后,你只需要使用 Apache Commons Codec 提供的 DigestUtils 方法就可以了。
/*** Test to get file's MD5 Hash** @throws Exception*/@Testpublic void fileMD5Test() throws Exception {String md5 = StringUtils.EMPTY;try {InputStream is = FileUtils.openInputStream(new File(SCOConstants.PATH_DATA_EXCHANGE + Estimated vs Original Manual (JIRA) 10-23-20.csv));md5 = DigestUtils.md5Hex(is);} catch (Exception e) {e.printStackTrace();}logger.debug(MD5 for File: {}, md5);}
上面的代码就可以直接获得 InputStream 的 MD5 哈希。
程序的输出为:
09:32:31.522 [main] DEBUG c.i.s.c.t.utilities.CodecUtilsTest - MD5 for File: 1ec6473fc1bd50a982767f555734af64
与 MD5 哈希算法是一致的。
Sha-3_11280×668 43 KB
你需要首先也将文件读取为 InputStream ,然后使用 Apache 提供的 DigestUtils.sha3_256Hex(is); 就可以了。
考察下面的代码:
/*** Test to get file's SHA3_256Hex Hash** @throws Exception*/@Testpublic void fileSHA3_256HexTest() throws Exception {String sha3Hex256 = StringUtils.EMPTY;try {InputStream is = FileUtils.openInputStream(new File(SCOConstants.PATH_DATA_EXCHANGE + Estimated vs Original Manual (JIRA) 10-23-20.csv));sha3Hex256 = DigestUtils.sha3_256Hex(is);} catch (Exception e) {e.printStackTrace();}logger.debug(SHA3_256Hex for File: {}, sha3Hex256);}
运行程序的输出为:
09:35:48.093 [main] DEBUG c.i.s.c.t.utilities.CodecUtilsTest - SHA3_256Hex for File: 47ec963787f3acf88747ca7a37ccac9e2cc9b05c87eda1852cb4bc3b0273a431
本文由梁桂钊于2023-03-19发表在梁桂钊的博客,如有疑问,请联系我们。
本文链接:https://720ui.com/6271.html