温馨提示×

温馨提示×

您好,登录后才能下订单哦!

密码登录×
登录注册×
其他方式登录
点击 登录注册 即表示同意《亿速云用户服务条款》

java中如何计算文本句子数

发布时间:2021-07-16 15:03:20 来源:亿速云 阅读:365 作者:小新 栏目:编程语言

小编给大家分享一下java中如何计算文本句子数,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!

1、任务简介

本节任务是计算文本中的句子数,并且对于句子数的划分标准为“。” “!”和“?”三种符号。

2、基本任务和代码

1)具体思路

(1)首先需要使用InputStreamReader类和BufferedReader类实现文本的读取,由于我使用的文本文档均为utf-8编码,所以还需要指定编码格式为utf-8;

(2)然后需要定义一个空的字符串变量,在对文本逐行读出后将读出的内容追加到该空字符串后;

(3)逐行读出文档,然后使用for循环对该行中的每一个字符进行遍历,使用toString()方法得到每一个字符,再使用if语句和equals()方法字符是否为“。” “!”和“?”三种符号之一,若为其中之一则句子数+1;

(4)将计算得出的句子长度打印出来;

2)任务代码

程序保存为juzi1.java,代码如下:

import java.io.*;//导入java.io包中的所有类
import java.util.Scanner;//导入java.util包中的Scanner类
public class juzi1 {//类名
 public static void main(String[] args) {//程序主函数
  try {//try代码块,当发生异常时会转到catch代码块中
   //读取指定的文件
   Scanner s = new Scanner(System.in);//创建scanner,控制台会一直等待输入,直到敲回车结束
   System.out.println("请输入想要打开的文本文档:");//输入提示信息
   String a = s.nextLine();//定义字符串变量,并赋值为用户输入的信息
   //创建类进行文件的读取,并指定编码格式为utf-8
   InputStreamReader read = new InputStreamReader(new FileInputStream(a),"utf-8"); 
   BufferedReader in = new BufferedReader(read);//可用于读取指定文件  
 StringBuffer b = new StringBuffer();//定义一个字符串变量b,便于后续进行内容追加的操作
 String str = null;//定义一个字符串类型变量str
 String d = null;//定义一个字符串类型变量c
 int e = 0;//定义一个int型变量,用于统计句子数
 while((str = in.readLine()) != null) {//readLine()方法, 用于读取一行,只要读取内容不为空就一直执行
 b.append(str);//将该行内容追加到字符串b的后面
 for (int j = 0; j < str.length(); j++) {//for循环的条件,当j小于该行长度时就一直循环并自增
    d = Character.toString(str.charAt(j));//返回一个字符串对象
    if (d.equals("。")||d.equals("?")||d.equals("!")) {//if语句的条件,判断是否为句子
      e++;//若为一句则e自增一次
     }
  }
 }
   in.close();//关闭流
   System.out.println("该文本共有"+e+"个句子");//输出总的句子数
  } catch (IOException e) {//当try代码块有异常时转到catch代码块
   e.printStackTrace();//printStackTrace()方法是打印异常信息在程序中出错的位置及原因
  }
 }
}

3)运行结果

(1)所有文件均保存在路径D:\demo7下,首先对一个简单的文本文档(格式为utf-8)的句子数进行计算,该文本文档命名为 lsy.txt,内容如下:

java中如何计算文本句子数

从中可以看出该文本文档中共有4句话,然后在命令行中对程序进行编译,并运行程序读取该txt文档,计算结果如下:

java中如何计算文本句子数

(2)最后在命令行下使用该程序对原版《西游记》txt文档进行计算,计算结果如下:

java中如何计算文本句子数

由此可以计算得出我使用的《西游记》文档共含有30804个句子。

以上是“java中如何计算文本句子数”这篇文章的所有内容,感谢各位的阅读!相信大家都有了一定的了解,希望分享的内容对大家有所帮助,如果还想学习更多知识,欢迎关注亿速云行业资讯频道!

向AI问一下细节

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

AI