C++中分割字符串主要有两种方法:一是使用std::string::find和substr手动迭代,适用于多字符分隔符和精细控制;二是利用std::istringstream结合std::getline进行流式处理,代码简洁且适合单字符分隔。前者支持复杂场景如跳过空字符串或限制分割次数,后者更符合C++惯用风格但仅限单字符分隔。性能敏感场景可考虑std::string_view减少拷贝,或使用Boost库优化。

在C++中按分隔符分割字符串,本质上就是在一段文本中找出特定的标记,然后把标记之间的内容提取出来。这事儿听起来简单,但实际操作起来,根据你的需求和对性能、代码可读性的偏好,会有几种不同的实现路径。核心思想无非是利用C++标准库提供的字符串查找和截取功能,或者借助流的特性来简化操作。
要高效且灵活地在C++中分割字符串,我通常会推荐两种主流方法:一种是基于
std::string::find
std::string::substr
std::istringstream
std::getline
方法一:基于std::string::find
std::string::substr
这种方法提供了最细粒度的控制,适合处理各种复杂情况,比如需要跳过空字符串、处理连续分隔符等。
立即学习“C++免费学习笔记(深入)”;
#include <string>
#include <vector>
#include <iostream>
std::vector<std::string> splitStringManual(const std::string& s, const std::string& delimiter) {
std::vector<std::string> tokens;
size_t lastPos = 0;
size_t pos = s.find(delimiter, lastPos);
while (pos != std::string::npos) {
// 提取从lastPos到pos之间的子串
tokens.push_back(s.substr(lastPos, pos - lastPos));
// 更新lastPos到分隔符之后
lastPos = pos + delimiter.length();
// 继续查找下一个分隔符
pos = s.find(delimiter, lastPos);
}
// 添加最后一个token(或整个字符串,如果没有分隔符)
tokens.push_back(s.substr(lastPos));
return tokens;
}
// 示例用法
/*
int main() {
std::string text = "apple,banana,,orange,grape";
std::string delim = ",";
std::vector<std::string> result = splitStringManual(text, delim);
std::cout << "Manual split results:" << std::endl;
for (const auto& token : result) {
std::cout << "[" << token << "]" << std::endl;
}
std::string text2 = "one|two||three";
std::string delim2 = "|";
std::vector<std::string> result2 = splitStringManual(text2, delim2);
std::cout << "\nManual split with '|':" << std::endl;
for (const auto& token : result2) {
std::cout << "[" << token << "]" << std::endl;
}
return 0;
}
*/方法二:利用std::istringstream
std::getline
这种方法对于单个字符分隔符来说,代码更简洁,更“C++ idiomatic”,尤其适合处理文件行、CSV数据等。
#include <string>
#include <vector>
#include <sstream> // for std::istringstream
#include <iostream>
std::vector<std::string> splitStringStream(const std::string& s, char delimiter) {
std::vector<std::string> tokens;
std::string token;
std::istringstream tokenStream(s); // 将字符串封装成输入流
while (std::getline(tokenStream, token, delimiter)) {
tokens.push_back(token);
}
// 注意:如果字符串以分隔符结尾,getline会产生一个空字符串。
// 如果原始字符串为空,或者只包含分隔符,这里可能需要额外处理。
return tokens;
}
// 示例用法
/*
int main() {
std::string text = "apple,banana,,orange,grape";
char delim = ',';
std::vector<std::string> result = splitStringStream(text, delim);
std::cout << "Stream split results:" << std::endl;
for (const auto& token : result) {
std::cout << "[" << token << "]" << std::endl;
}
std::string text2 = "one|two||three";
char delim2 = '|';
std::vector<std::string> result2 = splitStringStream(text2, delim2);
std::cout << "\nStream split with '|':" << std::endl;
for (const auto& token : result2) {
std::cout << "[" << token << "]" << std::endl;
}
return 0;
}
*/字符串分割这事儿,看起来直白,但实际用起来,总会遇到一些让人头疼的小问题,尤其是性能和边界情况的处理。
首先是空字符串(Empty Tokens)的问题。想象一下,如果你用逗号分割
"apple,,banana"
["apple", "", "banana"]
["apple", "banana"]
std::getline
splitStringManual
// 在分割结果后过滤空字符串
std::vector<std::string> filteredTokens;
for (const auto& token : result) {
if (!token.empty()) {
filteredTokens.push_back(token);
}
}其次是字符串开头或结尾是分隔符的情况。比如
" ,apple,banana,"
std::getline
splitStringManual
然后就是性能。对于大多数日常应用,这两种方法在性能上都不会成为瓶颈。但如果你的应用需要处理海量的字符串分割,或者字符串本身非常长,那么字符串拷贝的开销就值得关注了。
std::string::substr
std::string
std::getline
如果极致的性能是你的首要目标,你可能需要考虑:
std::string_view
std::string_view
string_view
\0
char*
boost::algorithm::split
我个人在大多数项目中,会优先选择
std::istringstream
std::getline
find/substr
std::istringstream
std::getline
std::istringstream
std::getline
它处理连续分隔符的行为,即产生空字符串,是其一大特性。比如
"a,,b"
["a", "", "b"]
但它的局限性在于,
std::getline
char
"##"
std::getline
std::string::find
std::string::substr
不过,我们可以稍微“曲线救国”一下,让
istringstream
std::isspace
std::istringstream
operator>>
std::vector<std::string> splitByWhitespace(const std::string& s) {
std::vector<std::string> tokens;
std::istringstream iss(s);
std::string token;
while (iss >> token) { // 自动按空白字符分割
tokens.push_back(token);
}
return tokens;
}
// 示例: " hello world " -> ["hello", "world"]这种方法会自动跳过所有连续的空白字符,不会产生空字符串,这在处理用户输入或命令行参数时非常方便。
再进一步,如果你想对分割后的token进行一些即时处理,比如去除首尾空白,或者转换为数字,可以在
while
istringstream
// 假设我们有一个CSV行,想把数字字段提取出来并转换为int
std::string csvLine = "10,20,,40";
std::istringstream iss(csvLine);
std::string tokenStr;
std::vector<int> numbers;
while (std::getline(iss, tokenStr, ',')) {
if (!tokenStr.empty()) { // 过滤空字符串
try {
numbers.push_back(std::stoi(tokenStr)); // 转换为int
} catch (const std::invalid_argument& e) {
std::cerr << "Invalid number: " << tokenStr << std::endl;
} catch (const std::out_of_range& e) {
std::cerr << "Number out of range: " << tokenStr << std::endl;
}
}
}
// numbers 现在是 [10, 20, 40]这种直接在循环中处理token的方式,避免了先生成所有token再遍历的二次开销,对于处理大量数据时,性能优势会更明显。
find
substr
当我需要处理更复杂的分隔符模式,或者对分割过程有更细致的控制时,
std::string::find
std::string::substr
std::getline
std::getline
它的核心逻辑是维护两个位置索引:
lastPos
pos
lastPos
pos
lastPos
// 再次展示手动分割函数,这次加上一些注释和思考
std::vector<std::string> splitStringManualAdvanced(const std::string& s, const std::string& delimiter, bool skipEmpty = false) {
std::vector<std::string> tokens;
size_t lastPos = 0;
size_t pos = s.find(delimiter, lastPos); // 从lastPos开始查找分隔符
while (pos != std::string::npos) { // 只要还能找到分隔符
std::string token = s.substr(lastPos, pos - lastPos); // 提取当前token
if (!skipEmpty || !token.empty()) { // 根据skipEmpty决定是否添加空token
tokens.push_back(token);
}
lastPos = pos + delimiter.length(); // 更新lastPos到分隔符之后
pos = s.find(delimiter, lastPos); // 继续查找下一个分隔符
}
// 处理最后一个token(或整个字符串,如果没找到分隔符)
std::string lastToken = s.substr(lastPos);
if (!skipEmpty || !lastToken.empty()) {
tokens.push_back(lastToken);
}
return tokens;
}这里我给函数增加了一个
skipEmpty
skipEmpty
true
"a,,b"
这种方法在处理多字符分隔符时是必不可少的。比如,你想用
"<<>>"
"data<<>>more_data<<>>end"
std::getline
find
std::string text = "data<<>>more_data<<>>end"; std::string delim = "<<>>"; std::vector<std::string> result = splitStringManualAdvanced(text, delim); // 结果会是 ["data", "more_data", "end"]
此外,当你需要限制分割次数时,手动实现也更容易。例如,你只想分割前N个token,剩下的作为最后一个token:
std::vector<std::string> splitLimited(const std::string& s, const std::string& delimiter, int maxSplits) {
std::vector<std::string> tokens;
size_t lastPos = 0;
size_t pos;
int splitsCount = 0;
while ((pos = s.find(delimiter, lastPos)) != std::string::npos && splitsCount < maxSplits) {
tokens.push_back(s.substr(lastPos, pos - lastPos));
lastPos = pos + delimiter.length();
splitsCount++;
}
tokens.push_back(s.substr(lastPos)); // 添加剩余部分作为最后一个token
return tokens;
}
// 示例: splitLimited("a,b,c,d", ",", 1) -> ["a", "b,c,d"]这种精细的控制,正是手动
find/substr
以上就是如何在C++中按分隔符分割字符串_C++字符串分割实现技巧的详细内容,更多请关注php中文网其它相关文章!
每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号