Java中从字符串提取指定长度单词:Stream API实践指南
技术百科
DDD
发布时间:2025-09-03
浏览: 次 任务概述
在java编程中,我们经常需要处理字符串,其中一项常见任务是从一个包含多个单词的句子中,筛选出所有长度符合特定要求的单词。例如,给定一个字符串"monday is a new day"和一个长度3,我们期望得到{"new", "day"}。如果长度是2,则期望得到{"is"}。
传统的做法可能涉及手动遍历字符串,通过查找空格来识别单词边界,然后截取子字符串并检查其长度。这种方法虽然可行,但在代码的简洁性、可读性和潜在的效率方面往往不如现代Java提供的API。
解决方案:结合String.split()与Java Stream API
Java提供了一套强大且富有表现力的API来处理这类字符串和集合操作,特别是String.split()方法和Java 8引入的Stream API。这种组合可以使我们的代码更加简洁、高效。
1. 拆分字符串为单词数组 (String.split())
首先,我们需要将输入的句子字符串拆分成独立的单词。String.split(String regex)方法是完成此任务的理想选择。它接受一个正则表达式作为分隔符,并将字符串拆分为一个String数组。
对于以空格分隔的单词,我们可以使用" "作为分隔符。
例如:"Monday is a new d
ay".split(" ") 将返回{"Monday", "is", "a", "new", "day"}。
注意事项:
- 如果句子中存在多个连续的空格(例如"Hello world"),split(" ")可能会在结果数组中产生空字符串。为了更健壮地处理这种情况,可以使用正则表达式"\\s+",它匹配一个或多个空白字符。
- 如果句子可能包含标点符号(例如"day."),并且希望将标点符号与单词分离,则需要在split()之前或之后进行额外的处理,例如使用replaceAll("[^a-zA-Z\\s]", "")来移除标点符号。
2. 转换为流进行处理 (Arrays.stream())
一旦我们将句子拆分成了String数组,就可以利用Java Stream API对其进行高效处理。Arrays.stream(T[] array)方法可以将一个数组转换为一个Stream。
String[] words = s.split(" ");
Stream wordStream = Arrays.stream(words); 3. 筛选指定长度的单词 (filter())
Stream API的核心优势之一是其声明式的中间操作,如filter()。filter()方法接受一个Predicate(一个返回布尔值的函数),并只保留那些使Predicate返回true的元素。
在本例中,我们需要筛选出长度与给定wordLength相等的单词。我们可以使用Lambda表达式word -> word.length() == wordLength作为filter()的参数。
wordStream.filter(word -> word.length() == wordLength)
4. 收集结果为数组 (toArray())
经过filter()操作后,流中只剩下符合条件的单词。最后一步是将这些单词收集回一个数组。toArray(IntFunction
.toArray(String[]::new)
完整代码示例
将上述步骤整合到一个方法中,我们可以得到一个简洁且高效的解决方案:
import java.util.Arrays;
import java.util.stream.Stream;
public class WordExtractor {
/**
* 从给定的句子中提取所有指定长度的单词。
* 单词通过空格分隔,并只返回长度与wordLength相等的单词。
*
* @param s 包含多个单词的输入句子。
* @param wordLength 要查找的单词的指定长度。
* @return 包含所有符合指定长度单词的字符串数组。
*/
public String[] findWords(String s, int wordLength) {
if (s == null || s.trim().isEmpty()) {
return new String[0]; // 处理空字符串或只包含空格的字符串
}
// 使用split(" ")将句子拆分为单词数组
// 然后转换为Stream
return Arrays.stream(s.split(" "))
// 过滤掉长度不等于wordLength的单词
.filter(word -> word.length() == wordLength)
// 过滤掉可能由多个连续空格产生的空字符串
.filter(word -> !word.isEmpty())
// 将过滤后的单词收集回一个String数组
.toArray(String[]::new);
}
public static void main(String[] args) {
WordExtractor extractor = new WordExtractor();
String sentence1 = "Monday is a new day";
int len1 = 3;
String[] result1 = extractor.findWords(sentence1, len1);
System.out.println("Sentence: \"" + sentence1 + "\", Length: " + len1 + " -> " + Arrays.toString(result1)); // Expected: [new, day]
String sentence2 = "Monday is a new day";
int len2 = 2;
String[] result2 = extractor.findWords(sentence2, len2);
System.out.println("Sentence: \"" + sentence2 + "\", Length: " + len2 + " -> " + Arrays.toString(result2)); // Expected: [is]
String sentence3 = " hello world java ";
int len3 = 5;
String[] result3 = extractor.findWords(sentence3, len3);
System.out.println("Sentence: \"" + sentence3 + "\", Length: " + len3 + " -> " + Arrays.toString(result3)); // Expected: [hello, world]
String sentence4 = "";
int len4 = 3;
String[] result4 = extractor.findWords(sentence4, len4);
System.out.println("Sentence: \"" + sentence4 + "\", Length: " + len4 + " -> " + Arrays.toString(result4)); // Expected: []
}
}代码可读性与命名规范
在上述示例中,我们特意将方法名从howManyWord更改为findWords,并将参数名从n更改为wordLength。这样做是为了提高代码的可读性和自解释性:
- findWords清晰地表明了方法的目的是“找到”单词,而不是“计算数量”(howMany通常暗示返回一个整数)。
- wordLength比n更具体,一眼就能看出它代表的是单词的长度。
良好的命名习惯是编写专业、易于维护代码的关键组成部分。
总结
通过结合String.split()和Java Stream API,我们可以以一种非常简洁、声明式且高效的方式,从句子中提取指定长度的单词。这种方法不仅减少了手动循环和条件判断的复杂性,还提高了代码的可读性和维护性。在处理集合数据时,Stream API是Java开发者工具箱中一个极其有用的工具。在实际应用中,根据具体需求,可能还需要考虑更复杂的字符串预处理,例如去除标点符号或处理不同类型的空白字符。
# ai
# 工具
# word
# java
# red
# 正则表达式
# 字符串数组
# 代码可读性
# java开发
# java编程
相关栏目:
<?muma
$count = M('archives')->where(['typeid'=>$field['id']])->count();
?>
【
AI推广<?muma echo $count; ?>
】
<?muma
$count = M('archives')->where(['typeid'=>$field['id']])->count();
?>
【
SEO优化<?muma echo $count; ?>
】
<?muma
$count = M('archives')->where(['typeid'=>$field['id']])->count();
?>
【
技术百科<?muma echo $count; ?>
】
<?muma
$count = M('archives')->where(['typeid'=>$field['id']])->count();
?>
【
谷歌推广<?muma echo $count; ?>
】
<?muma
$count = M('archives')->where(['typeid'=>$field['id']])->count();
?>
【
百度推广<?muma echo $count; ?>
】
<?muma
$count = M('archives')->where(['typeid'=>$field['id']])->count();
?>
【
网络营销<?muma echo $count; ?>
】
<?muma
$count = M('archives')->where(['typeid'=>$field['id']])->count();
?>
【
案例网站<?muma echo $count; ?>
】
<?muma
$count = M('archives')->where(['typeid'=>$field['id']])->count();
?>
【
精选文章<?muma echo $count; ?>
】
相关推荐
- 如何使用Golang sort排序切片_Golan
- 如何在 ACF 中正确更新嵌套多层 Group 字
- Mac怎么给文件夹加密_Mac创建加密磁盘映像教程
- Python数据挖掘进阶教程_分类回归与聚类案例解
- Python文本编码与解码_跨平台解析说明【指导】
- Win11讲述人怎么关闭_Win11误触开启语音朗
- Linux怎么查找死循环进程_Linux系统负载分
- mac怎么分屏_MAC双屏显示与分屏操作技巧【指南
- Python模块的__name__属性如何由导入方
- Win10怎么关闭自动更新错误重启 Win10策略
- 如何使用Golang处理静态文件缓存_提高页面加载
- 如何使用Golang反射创建map对象_动态生成键
- c++怎么使用std::unique实现去重_c+
- php485函数执行慢怎么优化_php485性能提
- 微信里的php文件怎么变mp4_微信接收php转m
- 如何在Golang中引入测试模块_Golang测试
- php下载安装包太大怎么下载_分卷压缩下载方法【教
- SAX解析器是什么,它与DOM在处理大型XML文件
- Win11怎么关闭透明效果_Windows11个性
- Drupal 中渲染节点时出现 HTML 标签嵌套
- c++ try_emplace用法_c++ map
- Win11怎么清理C盘虚拟内存_Win11清理虚拟
- Win11怎样激活系统密钥_Win11系统密钥激活
- Windows怎样拦截WPS弹窗广告_Window
- Win11怎么设置开机问候语_自定义Win11锁屏
- php控制舵机角度怎么调_php发送pwm信号控制
- 如何使用Golang实现多重错误处理_Golang
- Win11怎么更改系统语言_Win11中文语言包下
- 如何使用Golang开发基础文件下载功能_Gola
- Linux如何安装JDK11_Linux环境变量配
- Win11怎么关闭用户账户控制UAC_Window
- Win10文件历史记录怎么用 Win10开启自动备
- Linux怎么修改用户密码_Linux系统pass
- PHP主流架构如何做单元测试_工具与流程【详解】
- Win11怎么关闭触摸键盘图标_Windows11
- Windows系统文件被保护机制阻止怎么办_权限不
- 如何在Golang中编写异步函数测试_Golang
- Mac怎么设置鼠标滚动速度_Mac鼠标设置详细参数
- Win11怎么关闭自动修复_跳过Win11开机自动
- Win11怎么设置多显示器任务栏 Win11扩展任
- 如何使用Golang实现云原生应用弹性伸缩_自动应
- windows 10应用商店区域怎么改_windo
- Windows10系统怎么查看CPU核心数_Win
- Win11怎么清理C盘系统日志_Win11清理系统
- Python 模块的 __name__ 属性如何由
- MAC如何安装Git版本控制工具_MAC开发环境配
- 如何在Golang中实现自定义Benchmark_
- Win10如何更改电脑休眠时间_Windows10
- 如何使用Golang写入二进制文件_Golang
- php中self::能调用子类重写的方法吗_静态绑

QQ客服