java 使用mmseg4j demo

以下是使用mmseg4j来进行中文分词的示例代码：

import com.chenlb.mmseg4j.*;
import java.io.*;

public class MMSegDemo {
    public static void main(String[] args) throws IOException {
        String input = "我爱北京天安门";
        // 创建一个 SimpleSeg 实例
        Seg seg = new SimpleSeg(new File("data"));
        // 创建一个 MaxWordSeg 实例
        //Seg seg = new MaxWordSeg(new File("data"));
        MMSeg mmSeg = new MMSeg(new StringReader(input), seg);
        Word word = null;
        while((word=mmSeg.next())!=null) {
            System.out.print(word.getString()+"|");
        }
    }
}

在这个示例中，我们使用了mmseg4j中的SimpleSeg，而不是MaxWordSeg。SimpleSeg只是简单地根据字典中的词对文本进行分词，而MaxWordSeg会使用更加复杂的算法来尝试找到最长的匹配词语。您可以根据自己的需要选择其中一个。

在这个示例中，我们将“我爱北京天安门”作为输入文本，然后使用mmseg4j来对其进行分词。我们使用了一个MMSeg实例，它接受一个StringReader对象和一个Seg对象作为参数。然后我们可以使用next()方法来获取下一个词语并输出它们。

输出为：“我|爱|北京|天安门|”