当前位置: 首页 > news >正文

网站 硬件方案西安知名互联网公司

网站 硬件方案,西安知名互联网公司,企业营销型网站做的好,网站编辑是什么C17 并行化STL算法 文章目录 C17 并行化STL算法概念环境准备工具类 并行算法 - 使用并行算法 - 执行策略总览选择标准详细介绍顺序执行 seq并行化顺序执行 par并行化乱序执行 par_unseq 并行算法 - 异常处理可以不使用并行算法并行算法 - 限制并行算法有哪些原有算法17引入新算…

C++17 并行化STL算法

文章目录

  • C++17 并行化STL算法
    • 概念
      • 环境准备
      • 工具类
    • 并行算法 - 使用
    • 并行算法 - 执行策略
      • 总览
      • 选择标准
      • 详细介绍
        • 顺序执行 seq
        • 并行化顺序执行 par
        • 并行化乱序执行 par_unseq
    • 并行算法 - 异常处理
    • 可以不使用并行算法
    • 并行算法 - 限制
    • 并行算法有哪些
      • 原有算法
      • 17引入新算法

概念

为了从现代的多核体系中受益,C++17标准库引入了并行 STL算法,允许使用多个线程并行处理元素。

C++17为许多算法扩展了一个新的参数来指明是否要并行运行算法。并且新增了一些专为并行编程补充的新算法。

环境准备

并行算法在 linux上使用 gcc 或者 clang进行编译,需要

  1. 安装 tbb库—— 线程构建模块 (TBB) Thread Building Blocks
  2. 链接时指定-ltbb选项

否则:

tbb链接结果
安装指定-ltbb选项可正常使用并行算法
安装未指定编译错误
未安装指定编译错误
未安装未指定正常编译,但并行算法会串行化,变得和串行算法一样
# 编译选项
g++ ‐std=c++17 ‐ltbb main.cpp ‐o a.out

工具类

有时需要计时器来测量算法的速度。因此,引入一个简单的辅助类。

初始化一个计时器,提供 printDiff()来打印出消耗的毫秒数 并 重新初始化计时器

#include <iostream>
#include <string>
#include <chrono>
/********************************************
* timer to print elapsed time
********************************************/
class Timer {
private:std::chrono::steady_clock::time_point last;
public:Timer() : last{std::chrono::steady_clock::now()} {}void printDiff(const std::string& msg = "Timer diff: ") {auto now{std::chrono::steady_clock::now()};std::chrono::duration<double, std::milli> diff{now ‐ last};std::cout << msg << diff.count() << "ms\n";last = std::chrono::steady_clock::now();}
};

并行算法 - 使用

怎么让现有算法并行运行和使用新的并行算法

  • 包含头文件 <execution>
#include <execution> 
  • C++17之后,一般来说可以向并行 STL算法传递不同的 执行策略 (execution policies) 作为第一个参数。

    • cpprefrence上看看STL算法支不支持,一般是:添加执行策略到第一个参数即可。例如,std::execution::par

    • 使用参数 传递/修改 执行策略 的好处:可在运行时更改策略时(顺序执行/并行执行),不需要再修改调用方式。

所有的并行算法要求迭代器至少是前向迭代器。

#include <execution> // for 执行策略
#include <algorithm>std::vector<std::string> coll {"a", "b", "c"};sort(coll.begin(), coll.end());
sort(std::execution::seq, coll.begin(), coll.end());
sort(std::execution::par, coll.begin(), coll.end());
sort(std::execution::par_unseq, coll.begin(), coll.end());// 并行计算平方根
for_each(std::execution::par,coll.begin(), coll.end(),[] (auto& val) {val.sqrt = std::sqrt(val.value);});

并行算法 - 执行策略

总览

以下执行策略,分别是定义在 namespace std中的新类(sequenced_policyparallel_policyparallel_unsequenced_policy)的 constexpr对象。

执行策略含义
std::execution::seq顺序执行
std::execution::par并行化顺序执行
std::execution::par_unseq并行化乱序(矢量化)执行

标准库提供了新的类型特征 std::is_execution_policy<>,在泛型编程中检查模板参数是否是执行策略。

并行化乱序执行需要编译器/硬件的特殊支持,从而检测如何矢量化。

非并行化/并行化

  1. 并行化——多个线程执行
  2. 非并行化——单一线程

顺序、乱序

  1. 乱序:允许矢量化执行,不保证顺序地对元素执行操作。

    即存在可能:

    • 某个线程在执行完某一个元素的处理之前可能会切换到其他的元素。

    • 某个线程先执行多个元素的第一步处理,再回过头来对这些元素执行下一步处理。

  2. 顺序:不允许矢量化执行,顺序地对元素执行操作

    当某个线程对新的元素进行操作之前,它会先处理完它之前处理过的其他元素。

选择标准

benchmark测试结果,主要依赖于硬件、使用的 C++编译器、使用的 C++库(并行算法实际运行的方式是实现特定的)

没有通用的方法来判断什么场景什么时间值得使用并行算法。不能说多线程就一定比顺序执行好:启动和控制多线程也会消耗时间

理论上讲,如下判断依据可以作为参考:

  • 简单算法(每个元素计算耗时短),元素数量少。并行执行永远会更慢建议顺序执行 std::execution::seq 或 默认版本。

  • 复杂算法(每个元素计算耗时长),元素数量多。适合使用并行算法

    • 处理过程需要独立于其他元素的处理 —— 并行化顺序执行 std::execution::par
    • 处理过程不需要独立于其他元素的处理 —— 并行化乱序执行 std::execution::par_unseq

详细介绍

顺序执行 seq

std::execution::seq 指定顺序执行

  • 策略本身:

    • 单一线程执行
    • 单个线程对所有元素逐个执行操作。不允许矢量化执行,顺序地对元素执行操作——当某个线程对新的元素进行操作之前,它会先处理完它之前处理过的其他元素。
  • 与非并行化版本进行对比

    • 实际上,该策略非常类似不接受执行策略参数的非并行化版本
    • 但多一些约束条件:例如 for_each()不能返回值,所有的迭代器必须至少是前向迭代器
  • 提供该策略的目的:

    • 可只修改一个参数来要求顺序执行,而不是换用一个签名不同的函数。
并行化顺序执行 par

std::execution::par 指定并行化顺序执行

  • 策略本身:

    • 多个线程执行
    • 顺序执行:允许矢量化
  • 提供该策略的目的:

    • 比非并行化顺序执行,可能要快一些

    • 避免在以下情况中出现死锁或其它bug(与 par_unseq不同)

      执行了某个元素的第一步处理后必须在执行另一个元素的第一步处理之前执行这个元素接下来的处理步骤。

并行化乱序执行 par_unseq

std::execution::par_unseq 指定并行化乱序执行

  • 策略本身:
    • 多个线程执行
    • 乱序执行:允许矢量化
  • 提供该策略的目的:
    • 比非矢量化 顺序执行,可能要快一些

并行化乱序执行需要编译器/硬件的特殊支持来检测哪些操作如何矢量化。

并行算法 - 异常处理

当指定了执行策略后:

  • 处理元素的函数,因未捕获的异常而退出时,会调用 std::terminate()

  • 注意即使选择了顺序执行策略也会这样。

注意:存在并行算法本身抛出异常的可能性!

例如,申请并行执行所需的临时内存资源时失败了,会抛出 std::bad_alloc 异常。从而直接 std::terminate()

所以,使用非并行化版本的算法有时是更好的选择。

可以不使用并行算法

使用非并行算法可以提供以下好处:

  • 可以使用输入和输出迭代器。
  • 算法不会在遇到异常时 std::terminate()
  • 算法可以避免因为意外使用元素导致的副作用。
  • 算法可以提供额外的功能,例如 for_each()会返回传入的可调用对象,我们可能会需要该对象最终的状态

并行算法 - 限制

有限制的并行 STL算法

限制:返回类型 void、前向迭代器

for_each()

限制:前向迭代器

for_each_n() all_of(), and_of(), none_of() 
find(), find_if(), find_if_not() 
find_first_of() 
count(), count_if() 
mismatch() 
equal() 
is_partitioned() 
partial_sort_copy() 
includes() 
lexicographical_compare() 
fill_n() 
generate_n() 
reverse_copy() 
rotate_copy() 
copy(), copy_n(), copy_if() 
move() 
transform() 
replace_copy(), replace_copy_if() 
remove_copy(), remove_copy_if() 
unique_copy() 
partition_copy() 
merge() 
set_union(), set_intersection() 
set_differrnce(), set_symmetric_difference() 
inclusive_scan(), exclusive_scan() 
transform_inclusive_scan(), transform_exclusive_scan()

并行算法有哪些

原有算法

C++17之前,标准中不需要修改就可以并行运行的算法

find_end(), adjacent_find()
search(), search_n()(和“搜索器”一起使用时除外)
swap_ranges()
replace(), replace_if()
fill()
generate()
remove(), remove_if(), unique()
reverse(), rotate()
partition(), stable_partition()
sort(), stable_sort(), partial_sort()
is_sorted(), is_sorted_until()
nth_element()
inplace_merge()
is_heap(), is_heap_until()
min_element(), max_element(), min_max_element()

无并行版本的算法

  • 为了并行地运行 accumulate(),使用reduce() 或者transform_reduce()。
  • 为了并行地运行 partial_sum(),使用…scan()算法。
  • 为了并行地运行 inner_product(),使用transform_reduce()。
accumulate()
partial_sum()
inner_product()
search()(和“搜索器”一起使用时)
copy_backward(), move_backward()
sample(), shuffle()
partition_point()
lower_bound(), upper_bound(), equal_range()
binary_search()
is_permutation()
next_permutation(), prev_permutation()
push_heap(), pop_heap(), make_heap(), sort_heap()

17引入新算法

http://www.yayakq.cn/news/818797/

相关文章:

  • 学校网站英文产品做网站推广
  • 服装网站建设公司哪家好天津网站优化公司
  • 建设银行网站调用支付源码网站建设公司的
  • 深圳加盟网站建设网站备案信息保护
  • 网站内页优化wordpress学院主题
  • seo网站推广可以自己搞吗wordpress导入微信
  • 网站随机代码东莞seo全网营销
  • 快速做网站流量数据统计分析绍兴seo计费管理
  • 制作php网站用什么软件域名注册备案
  • 网站页面设计公司广州网址大全
  • 易语言如何做网站网页游戏用什么开发
  • 一个网站怎么做关键词搜索国外优秀的html5网站
  • 网站开发实训logo制作用什么软件
  • 厦门论坛网站建设深圳网站设计推广
  • 怎么做自己的电影网站兴科cms网站建设系统
  • 手表哪个网站最好株洲房产网
  • 教育视频培训网站建设产品网页
  • 南昌哪里做网站好wordpress当前位置修改
  • 织梦修改网站后备份万能浏览器手机版下载安装
  • 画出网站开发项目流程图太原建站建设
  • 设计网站建设书南昌怎么用群晖nas做网站
  • 保定网站制作推广湛江人才网
  • 网站核验为个人实际是公司网站开发服务器知识
  • 网站建设如何推广系统开发的大概步骤
  • 马鞍山网站建设服务开发网上电商
  • saas建站没有网站源代码么深圳营销推广公司
  • 整站seo排名费用价格网站 设计报价
  • 网上购物型网站深圳电器公司简介
  • 百度云网站建设教程本地推广平台有哪些
  • 网站改版 价格开福区城乡建设局门户网站