使用std::string_view实现无拷贝字符串分割,通过find定位分隔符并返回子串视图,避免内存分配;支持自定义谓词分割与空字段处理,结合emplace_back和reserve优化性能,适用于高效大文本解析场景。

在C++中实现一个高效的字符串分割函数,关键在于避免不必要的内存分配和拷贝操作。标准库没有提供原生的split函数,因此需要手动实现。一个高效且实用的方案是结合std::string_view(C++17起)来避免复制子串,仅记录位置和长度。
std::string_view 是轻量级的字符串视图,不拥有数据,只持有指针和长度,非常适合用于分割场景。
以下是一个高效的split函数实现:
#include <string_view>
#include <vector>
#include <algorithm>
<p>std::vector<std::string_view> split_string(std::string_view str, char delimiter) {
std::vector<std::string_view> result;
size_t start = 0;</p><pre class='brush:php;toolbar:false;'>while (start < str.size()) {
auto end = str.find(delimiter, start);
if (end == std::string_view::npos) {
result.emplace_back(str.substr(start));
break;
}
result.emplace_back(str.substr(start, end - start));
start = end + 1;
}
return result;}
立即学习“C++免费学习笔记(深入)”;
这个版本的优点:
string_view形式返回find快速定位分隔符,减少循环开销如果需要更灵活的分割逻辑,比如按多个字符或条件分割,可以扩展接口:
std::vector<std::string_view> split_by_predicate(std::string_view str,
const std::function<bool(char)>& pred) {
std::vector<std::string_view> result;
size_t start = 0;
<pre class='brush:php;toolbar:false;'>for (size_t i = 0; i <= str.size(); ++i) {
if (i == str.size() || pred(str[i])) {
if (i > start) {
result.emplace_back(str.substr(start, i - start));
}
start = i + 1;
}
}
return result;}
立即学习“C++免费学习笔记(深入)”;
调用示例:
auto parts = split_by_predicate("a,b;c|d", [](char c) {
return c == ',' || c == ';' || c == '|';
});
有些场景下连续分隔符应视为多个空字段(如CSV),而有些则需忽略。可以通过参数控制行为:
若要跳过空字段,在添加前判断长度即可:
if (i > start) { // 只有非空才加入
result.emplace_back(...);
}
std::string_view代替std::string接收输入reserve)push_back,改用emplace_back
基本上就这些。核心思路是:能不用拷贝就不拷贝,能少遍历就少遍历。配合现代C++特性,既能写出清晰代码,又能保证高性能。
以上就是c++++怎么实现一个高效的字符串分割函数_c++文本解析与字符串操作技巧的详细内容,更多请关注php中文网其它相关文章!
c++怎么学习?c++怎么入门?c++在哪学?c++怎么学才快?不用担心,这里为大家提供了c++速学教程(入门到精通),有需要的小伙伴保存下载就能学习啦!
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号