当前位置: 首页 > news >正文

做pc端网站渠道潍坊做网站优化

做pc端网站渠道,潍坊做网站优化,男女做那个的小视频网站,优秀网站图标原文 使用LDC的(LTO)链接时优化的简短文章,包含演示了如何提高程序性能的简单示例.因为LTO在LLVMIR级别工作,因此可跨越C/D语言优化! 重要提示:LDC/LLVM的LTO在窗口上不可用. 链接时优化 (LTO)链接时优化是指链接时的程序优化.链接器提取所有目标文件在一起,并合并到一个程序…

原文
使用LDC(LTO)链接时优化的简短文章,包含演示了如何提高程序性能简单示例.因为LTOLLVMIR级别工作,因此可跨越C++/D语言优化!

重要提示:LDC/LLVMLTO窗口上不可用.

链接时优化

(LTO)链接时优化是指链接时的程序优化.链接器提取所有目标文件在一起,并合并一个程序中.链接器可看见整个程序,因此可分析和优化整个程序.
但是,一般链接器只有在程序已转换为机器码时才可见程序.在该级别上,应仍可优化,但这很难.不能使用GCCLLVM的优化器.

GCC相同,LLVMLTO机制基于传递LLVM优化器可理解的(LLVMIR)代码给链接器,从而可在链接过程中执行全程序分析和优化.

所谓的"完整"LTO组合单独目标文件的所有LLVMIR代码到一个大的LLVM模块中,然后优化它并如常生成机器码.
"ThinLTO"分开模块,但从其他模块按需导入函数,并并行优化和生成机器码.更多

可在一次编译调用中改进全LTO的所有优化,一次编译就可.一次编译所有是配音(dub),也是目前LDC自身(D部分)的构建方式.

LTO而不是一次编译的优点是,LTO的(部分)编译是并行完成的.对完整的LTO(-flto=full),只有语义分析是并行完成的,而优化和生成机器码是在单线程中完成的.
ThinLTO(-flto=thin),除全局分析步骤外,所有步骤都是并行完成的.因此,ThinLTO比全LTO一次编译快得多,尤其是在拥有多个可用内核机器时.

要使用LTO,只需要在命令行上指定-flto=thin-flto=full!

链接器支持

LTO的工作方式是,编译器输出的目标文件不是普通目标文件:它们是LLVMIR位码文件,仅由目标文件扩展名伪装成目标文件.表明链接器必须支持此LLVM的LTO机制.

MacOSX上,LLVM/Clang用作系统编译器,链接器知道如何用libLTO.DYLIB库处理LTO.适合MacOSXLDC附带此库,因此它是LDCLLVM版本的最新版本.

Linux上,黄金链接器支持插件,LLVM黄金插件用来处理LTO.
然后,可复制二进制文件LDClib目录,或传递-flto-binary=<pluginfile>LDC,以便链接器可找到它.
LTO选项(如增量构建的ThinLTO缓存)可像一般的链接器选项一样传递:

OS X: ldc2 -L-cache_path_lto -L/path/to/cache ...
gold: ldc2 -L-plugin-opt=cache-dir=/path/to/cache ...

简单示例

考虑以下示例,代码分布在(lto_a.dlto_b.d)两个文件中:

// File lto_b.d
//用`extern(C++)`来允许用`C++`定义它
extern(C++) void doesNothing() {}
// File lto_a.d
extern(C++) void doesNothing(); //仅声明void main() {for (ulong i = 0; i < 1_000_000_000; ++i) {doesNothing();}
}

先编译lto_b.dlto_b.o,然后再编译lto_a.d,并与lto_b.o链接.该程序闲着,优化器应可弄清楚这一点,但是,优化器不能.编译lto_a.d时,它不知道Nothing()做了什么,因此不能做太多优化:程序循环1亿次调用立即返回的函数.在我机器上,大约需要2秒:

>  ldc2 -c -O3 lto_b.d -of=lto_b.o
>  ldc2 -O3 lto_a.d lto_b.o -of=program
>  time ./program
./program  1.81s user 0.01s system 98% cpu 1.845 total

使用LTO,导入doesNothing()lto_a模块中,优化器可发挥其神力:

>  ldc2 -c -O3 -flto=thin lto_b.d -of=lto_b.o
>  ldc2 -O3 -flto=thin lto_a.d lto_b.o -of=program_lto
>  time ./program_lto
./program_lto 0.00s 用户 0.00s 系统 28% CPU 总计 0.012 总计

一次编译器调用中,编译所有源码可获得相同运行时:

>  ldc2 -O3 lto_a.d lto_b.d -of=program_allatonce
>  time ./program_allatonce
./program_allatonce  0.00s user 0.00s system 44% cpu 0.008 total

打破C++/D语言障碍

D可(相对)轻松地与C++代码互操作.LDC自身就是个很好示例:LDC的前端是用D编写的,而它的后端(LLVM)是用C++编写的.
但是,不能一次编译所有源码来跨C++/D语言优化,因为C++D的编译器都无法理解对方.因此,如下C++函数不会内联到D函数中:

// File lto_b.cpp
void doesNothing() {}
>  clang -c -O3 lto_b.cpp -o lto_b.o
>  ldc2 -O3 lto_a.d lto_b.o -of=program_cpp
>  time ./program_cpp
./program_cpp  2.09s user 0.01s system 99% cpu 2.125 total

好消息是:LTO没有语言障碍.因为LTOLLVMIR级别工作,且LDCClang都编译为相同的LLVMIR语言,因此仅C++,仅DC++/D混合程序可实现相同优化潜力!

对给定示例,可通过以下构建步骤减少执行时间"零":

>  clang -c -O3 -flto=thin lto_b.cpp -o lto_b.o
>  ldc2 -O3 -flto=thin lto_a.d lto_b.o -of=program_cpp_lto -mtriple=x86_64-apple-macosx10.11.0
>  time ./program_cpp_lto
./program_cpp_lto  0.00s user 0.00s system 61% cpu 0.005 total

注意,调用ldc2时,必须显式指定目标三元组(这仅在OSX上需要).在MacOSX上,LDCClang默认使用略有不同的三元组.
三元组不同时,LTO代码生成器会抱怨.有趣的是,反向调用编译器时不需要显式提及三元组,但是必须显式传递D运行时库给Clang.

http://www.yayakq.cn/news/60061/

相关文章:

  • 制作个网站网站二维码悬浮
  • 响应式网站设计软件凡客诚品市场份额
  • 网页制作工具手机版首页关键词优化价格
  • 建平台网站费用海贼王路飞和女帝做的网站
  • 石家庄手机网站建设公司wordpress替换主页
  • 图书馆网站建设的规章制度铜陵做网站的
  • 网站运营培训高水平的大连网站建设
  • 宁波网站建设设计服务公司北京十大装饰装修公司
  • 网站策划书一般包括以下内容网站建设的售后服务
  • 网站悬浮代码怎么给产品做网络推广
  • 开发公司和建材商促销活动网站栏目页 优化
  • 网站建设seo方案济南旅游网站建设
  • h5网站模板开发成都市住房和城乡建设官网
  • 设计做图免费网站沈阳世纪兴网站制作
  • 南京360推广 网站建设嵌入式培训机构哪家好
  • 广州从化网站建设网站优化升级
  • proxy网站自己搭建网站的步骤
  • 紫色个人网站模板免费自助建站工具
  • 深圳app网站设计做企业网站电话销售话术
  • 龙江做网站有没学做早餐的网站
  • 基础建设的网站有哪些内容网站标题flash
  • 哪些网站做外贸甘肃省住房与城乡建设部网站
  • 无锡高端网站设计开发国外电商网站建设
  • 商业网站的创建程序如果是创建的网站
  • 网站建设钟振森wordpress怎么画表格
  • 房地产行业网站模版网站是什么意思
  • 深圳鸿运通网站建设齐鲁建设网站
  • ppt模板免费下载素材医学类南通网站建设优化公司
  • 无锡自适应网站开发网站建设 做一个网站需要多少钱
  • 在上面网站上可以做统计图WordPress中文版如何下载