JavaScript 文章相似度检测 - 去除空格和空字符
使用 JavaScript 代码检测两篇文章的相似度,需要先去除文章中的空格和空字符,才能进行准确的对比。本文将介绍如何使用 JavaScript 代码去除文章中的空格和空字符,并实现文章相似度检测功能。
代码中使用了 trim() 和 split() 方法来删除空格和空字符,确保文章对比准确性。具体实现如下:
var wordCount1 = text1.trim().split(/\s+/).length;
var wordCount2 = text2.trim().split(/\s+/).length;
其中,trim() 方法用于删除字符串两端的空格,split() 方法则使用正则表达式 /\s+/ 来将字符串按照空格分割成数组,再计算数组长度即为文章字数。
使用该方法可以有效地去除文章中的空格和空字符,提高文章对比的准确性。
代码示例
<!DOCTYPE html>
<html>
<head>
<title>文章对比相似度</title>
<link rel="stylesheet" type="text/css" href="style.css">
</head>
<body>
<div class="container">
<h1>文章对比相似度</h1>
<div class="input-group">
<label for="text1">文本框1:</label>
<textarea id="text1"></textarea>
<div id="word-count1"></div>
</div>
<div class="input-group">
<label for="text2">文本框2:</label>
<textarea id="text2"></textarea>
<div id="word-count2"></div>
</div>
<button id="btn">对比相似度</button>
<div id="result"></div>
</div>
<script src="https://code.jquery.com/jquery-3.6.0.min.js"></script>
<script type="text/javascript">
$(function() {
$('#btn').click(function() {
var text1 = $('#text1').val();
var text2 = $('#text2').val();
var similarity = getSimilarity(text1, text2);
var result = '';
var wordCount1 = text1.trim().split(/\s+/).length;
var wordCount2 = text2.trim().split(/\s+/).length;
if (similarity < 0.3) {
result = '相似度为:' + (similarity * 100).toFixed(2) + '%,判定为原创。';
} else if (similarity >= 0.3 && similarity <= 0.5) {
result = '相似度为:' + (similarity * 100).toFixed(2) + '%,文章相似度高。';
} else if (similarity > 0.5 && similarity <= 0.8) {
result = '相似度为:' + (similarity * 100).toFixed(2) + '%,相似度已经非常高。';
} else {
result = '相似度为:' + (similarity * 100).toFixed(2) + '%,纯属抄袭。';
}
$('#result').text(result);
$('#word-count1').text('字数:' + wordCount1);
$('#word-count2').text('字数:' + wordCount2);
});
function getSimilarity(text1, text2) {
var len1 = text1.length;
var len2 = text2.length;
var maxlen = Math.max(len1, len2);
var minlen = Math.min(len1, len2);
var same = 0;
for (var i = 0; i < minlen; i++) {
if (text1[i] == text2[i]) {
same++;
}
}
var similarity = same / maxlen;
return similarity;
}
});
</script>
</body>
</html>
总结
通过去除文章中的空格和空字符,可以提高文章对比的准确性,使文章相似度检测更加准确可靠。
原文地址: https://www.cveoy.top/t/topic/jrHK 著作权归作者所有。请勿转载和采集!