博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
(原创)发布一个c++11开发的轻量级的并行Task库TaskCpp
阅读量:5834 次
发布时间:2019-06-18

本文共 6990 字,大约阅读时间需要 23 分钟。

TaskCpp简介

  TaskCpp是c++11开发的一个跨平台的并行task库,它的设计思路来源于微软的并行计算库ppl和intel的并行计算库tbb,关于ppl和tbb我在有介绍。既然已经有了这两个大公司开发的并行计算库,我为什么还要开发自己的并行计算库。有两个原因:

  1. ppl只能在windows上用不能跨平台,tbb能跨平台,但是受限于原始设计,tbb的task比较弱没有ppl的强大,所以他们不能完全满足我的要求;
  2. 我觉得可以用c++11可以开发出一个轻量级的好用的并行task库。

  TaskCpp在接口设计上尽量和ppl保持一致,因为我觉得ppl的接口很好很强大。因此,TaskCpp的接口用法和语义和ppl基本是一致的。因为TaskCpp是一个轻量级的task库,总共也不过三百多行代码,本着简单够用的原则,只提供了一些和ppl类似的常用用法, 有些不常用的特性不考虑支持。比如,不支持任务的取消,因为加入任务的取消会导致增加很多复杂性,而实际中用得比较少,所以不考虑支持,够用就好。

支持的平台

需要支持c++11的编译器,建议编译器:

  • linux: GCC4.7+
  • windows: vs2012 nov ctp+, 最好是vs2013

库的使用

  使用TaskCpp仅仅需要包含头文件即可,在程序中使用只需要包含#include <TaskCpp.h>和少量的boost头文件即可。

TaskCpp的功能

TaskCpp提供一下功能:

  • 并行任务:一种并行执行若干工作任务的机制。
    • 基本的异步任务
    • 延续的任务
    • 组合任务
      • WhenAll
      • WhenAny
    • 任务组
  • 并行算法:并行作用于数据集合的泛型算法。
    • ParallelForeach算法
    • ParallelInvoke算法
    • ParallelReduce算法

TaskCpp用法介绍

并行任务

基本的异步任务Task

  Task会创建一个异步操作,这个异步操作发起方式是延迟加载方式发起的,即在调用Task的Wait或者Get时才真正发起异步操作。Task可以通过std::function或者lambda表达式去创建,不支持直接原生函数创建,如果要用原生函数需要先通过lambda或者std::function包装一下。Task的Wait接口只是等待异步操作结束。Task的Get接口接收参数并等待异步操作结束并返回结果。PPL中的get接口是不能接收参数的,TaskCpp的Get接口是可以接受任意参数的,更灵活一点,算是较PPL的一个小优点吧。下面是Task的基本用法:

#include 
using namespace Cosmos;void TestTask(){ Task
task([]{cout << 1 << endl; }); task.Wait(); Task
task1 = []{cout << 1 << endl; }; task1.Wait(); Task
task2 = []{cout << 1 << endl; return 1; }; cout << task2.Get() << endl; Task
task3 = [](int i){cout << i << endl; return i; }; cout << task3.Get(3) << endl;}
View Code

组合任务--WhenAll

  WhenAll保证一个任务集合中所有的任务完成。WhenAll函数会生成一个任务,该任务可在完成一组任务之后完成。 此函数可返回一个std::vector 对象,该对象包含集合中每个任务的结果。 以下基本示例使用WhenAll创建表示完成其他三个任务的任务。下面是WhenAll的基本用法:

void PrintThread(){    cout << std::this_thread::get_id() << endl;    std::this_thread::sleep_for(std::chrono::milliseconds(5));}void TestWhenAll(){    vector
> v = { Task
([]{PrintThread(); std::this_thread::sleep_for(std::chrono::seconds(5)); return 1; }), Task
([]{PrintThread(); return 2; }), Task
([]{PrintThread(); return 3; }), Task
([]{PrintThread(); return 4; }) }; cout << "when all " << endl; WhenAll(v).Get();}
View Code

  注意:WhenAll是非阻塞的,它只是创建一个任务,在Wait或Get时才发起异步操作。传递给WhenAll的任务必须是统一的。 换言之,它们必须都返回相同类型。

组合任务--WhenAny

  WhenAny在任务集合中任意一个任务结束之后就返回。函数会生成一个任务,该任务可在完成一组任务的第一个任务之后完成。 此函数可返回一个 std::pair 对象,该对象包含已完成任务的结果和集合中任务的索引。下面是WhenAny的基本用法:

void TestWhenAny(){    vector
> v = { Task
([]{PrintThread(); std::this_thread::sleep_for(std::chrono::seconds(5)); return 1; }), Task
([]{PrintThread(); return 2; }), Task
([]{PrintThread(); return 3; }), Task
([]{PrintThread(); return 4; }) }; cout << "when any " << endl; WhenAny(v).Then([](std::pair
& result) { cout << " index " << result.first << " result " << result.second << endl; return result.second; }).Then([](int result){cout << "any result: " << result << endl; }).Get();}
View Code

  注意:WhenAny是非阻塞的,它只是创建一个任务,在Wait或Get时才发起异步操作。传递给WhenAny的任务必须是统一的。 换言之,它们必须都返回相同类型。

任务组--TaskGroup

  TaskGroup可以并行的处理一组任务,TaskGroup可以接受多个task或者function,TaskGroup的Wait等待所有任务完成。下面是TaskGroup的基本用法:

void TestTaskGroup(){    Task
t1([]{PrintThread(); return 1; }); Task
t2([]{PrintThread(); return 2.123; }); Task
t3([]{PrintThread(); }); Task
t4([]{PrintThread(); return "ok"; }); TaskGroup group; group.Run(t1); group.Run(t2); group.Run(t3); group.Run(t4); //如果你觉得这样一个一个Run加入任务,你也可以一起Run group.Run(t1, t2, t3, []{PrintThread(); return 1; }); group.Wait();}
View Code

  PPL的task_group的任务只能是void()形式的,TaskCpp允许一些简单类型的任务如int()、double()、string()等,其实任务的返回类型没有实际意义,因为Wait没有返回值,这里支持多种返回类型的任务只不过是为了减少一点限制,用起来稍微方便一点罢了。PPL加入任务只能一个一个Run,要加入多个任务时有点繁琐,TaskCpp可以一次Run多个任务,比PPL要方便一些。这两点算是较PPL的两个小优点吧。

并行算法

ParallelForeach算法

  ParallelForeach算法与 STL std::for_each 算法类似,只是 parallel_for_each 算法并发执行任务。用法比较简单:

bool check_prime(int x) // 为了体现效果, 该函数故意没有优化.{    for (int i = 2; i < x; ++i)    if (x % i == 0)        return false;    return true;}void TestParallelFor(){    vector
v; for (int i = 0; i < 100000; i++) { v.push_back(i + 1); } boost::timer t; ParallelForeach(v.begin(), v.end(), check_prime); ParallelForeach(v.begin(), v.end(), check_prime); cout << "taskcpp: " << t.elapsed() << endl;}
View Code

ParallelInvoke算法

  ParallelInvoke算法并行执行一组任务。 在完成所有任务之前,此算法不会返回。 当您需要同时执行多个独立的任务时,此算法很有用。ParallelInvoke和TaskGroup的作用是一样的。用法比较简单:

void TestParaInvoke(){    auto f = []{cout << "1" << endl; return 1; };    ParallelInvoke(f, []{cout << "2" << endl; });}

ParallelReduce算法

  ParallelReduce算法在实际应用中比较常用,有点类似于map-reduce,可以并行的对一个集合进行reduce操作。ParallelReduce的用法稍微复杂一点,它的原型:

    • ParallelReduce(range,init, reduceFunc);
    • ParallelReduce(range,init, rangeFunc, reduceFunc);

  第一个参数是集合,第二个参数是算法的初始值,第三个参数rangeFunc是一个声称中间结果的函数,第四个参数是中间结果的汇聚函数。如果调用ParallelReduce(range,init, reduceFunc),则表示rangeFunc和reduceFunc是一个函数。

  下面的例子是并行的计算100000000个整数的和:

void TestParallelSum(){    vector
v; const int Size = 100000000; v.reserve(Size); for (int i = 0; i < Size; i++) { v.push_back(i + 1); } int i = 0; boost::timer t; auto r = ParallelReduce(v, i, [](const vector
::iterator& begin, vector
::iterator&end, int val) { return std::accumulate(begin, end, val); }); cout << t.elapsed() << " " << r << endl;}
View Code

  下面是并行查找最长的字符串的例子:

void TestFindString(){    vector
v; v.reserve(10000000); for (int i = 0; i < 10000000; i++) { v.emplace_back(std::to_string(i + 1)); } string init = ""; auto f = [](const vector
::iterator& begin, vector
::iterator&end, string& val) { return *std::max_element(begin, end, [](string& str1, string& str2){
return str1.length()
View Code

性能

  用四个测试用例对比测试了tbb、ppl、TaskCpp和单线程的性能。下图是测试对比的结果:

  可以看到TaskCpp的性能比单线程效率要高,总体上也优于ppl和tbb,其中ppl和tbb在某些场景下性能还不如单线程高,所以在使用时要以实际测试数据为准,并不是一用并行库效率就能提高。

下载地址

 

TaskCpp开源协议

  遵循LGPL(GNU General Public License)协议。

注意

TaskCpp是一个任务库,不是线程池,每启动一个task就会创建一个线程,如果需要线程池可以看。

联系我

  如果发现问题或者有什么建议请给我留言或者发邮件qicosmos@163.com . 

  c++11 boost技术交流群:296561497,欢迎大家来交流技术。

后记

  TaskCpp的开发和测试花费了我两三周的时间,开发之初我就计划将其开源,我希望更多的人能用起来并推广TaskCpp,促进它的发展。曾经有人问我,为什么坚持发原创文章分享技术,是不是有什么好处。我一下子还真答不上来,因为我根本就没有想过有啥好处,现在再想一下,好处嘛,分享的术也许对别人学习有帮助吧。再想想我这样做的原因,一个原因是兴趣,这要感谢c++11,是c++11让我觉得c++语言是非常有意思和有魅力的语言,总能带给人惊喜,没有c++11我也不可能完成TaskCpp库。还有就是一点点分享快乐的精神,我分享我快乐。最重要的原因是一点点梦想,c++中开源库太少了,很多框架和基础库都还不够,远远赶不上java,所以在使用和推广上不如java。但是我有一点梦想:我希望通过自己的一点努力能让c++的世界变得更加美好,能让c++开发者的日子变得美好。是的,正是这个梦想促使我将我开发的大部分代码都开源出来!也正是这个梦想促使我坚持写原创博客分享技术!

转载地址:http://bzucx.baihongyu.com/

你可能感兴趣的文章
享元模式(FlyWeight)
查看>>
单例模式(Singleton)
查看>>
Nodejs之express第三方核心模块的中间件——body-parser
查看>>
Codeforces Round #398 (Div. 2) A. Snacktower 模拟
查看>>
第一百五十二节,封装库--JavaScript,表单验证--年月日注入
查看>>
第一百五十九节,封装库--JavaScript,表单序列化结合ajax提交数据
查看>>
45:十进制到八进制
查看>>
手机端rem如何适配_rem详解及使用方法
查看>>
线性结构-栈的顺序存储和链式存储实现
查看>>
Win7 Windows Update更新的文件默认在哪个位置
查看>>
7-nginx-keepalived配置主从双击热备
查看>>
MongoDB学习笔记~复杂条件拼接和正则的使用
查看>>
DNS服务器的搭建
查看>>
Image.FromStream与Image.FromFile使用区别
查看>>
Unity发布安卓Splash Image适应手机、平板
查看>>
设备树API
查看>>
Eclipse 找不到Server选项
查看>>
jquery 实现菜单的下拉菜单
查看>>
python入门(3)python的解释器
查看>>
Angular、React.js 和Node.js到底选谁?
查看>>