1000字范文,内容丰富有趣,学习的好帮手!
1000字范文 > 优化级别linux gcc c - 有多少GCC优化级别?

优化级别linux gcc c - 有多少GCC优化级别?

时间:2020-05-05 12:43:09

相关推荐

优化级别linux gcc c  - 有多少GCC优化级别?

让我们解释一下GCC 5.1的源代码,看看O上发生了什么,因为在手册页上不清楚。

我们将得出结论:

O以上-O的任何内容与Os相同,但未来可能很容易改变,所以不要依赖它。

如果输入大于O的整数,GCC 5.1将运行未定义的行为。

参数只能有数字,或者优雅地失败。 特别是,这不包括像O这样的负整数

专注于子程序

首先要记住GCC只是O,-O,Os,collect2的前端。快速./XXX --help表示只有collect2和cc1需要-O,所以让我们关注它们。

和:

gcc -v -O100 main.c |& grep 100

得到:

COLLECT_GCC_OPTIONS='-O100' '-v' '-mtune=generic' '-march=x86-64'

/usr/local/libexec/gcc/x86_64-unknown-linux-gnu/5.1.0/cc1 [[noise]] hello_world.c -O100 -o /tmp/ccetECB5.

所以O被转发到-O和Os。

O在common.opt中

common.opt是内部文档中描述的GCC特定的CLI选项描述格式,并由opth-gen.awk和optc-gen.awk翻译为C.

它包含以下有趣的行:

O

Common JoinedOrMissing Optimization

-O Set optimization level to

Os

Common Optimization

Optimize for space rather than speed

Ofast

Common Optimization

Optimize for speed disregarding exact standards compliance

Og

Common Optimization

Optimize for debugging experience rather than speed or size

其中指定了所有O选项。 注意-O是如何与其他Os,OPT_O和O分开列入独立系列的。

当我们构建时,这会生成一个OPT_O文件,其中包含:

OPT_O = 139, /* -O */

OPT_Ofast = 140, /* -Ofast */

OPT_Og = 141, /* -Og */

OPT_Os = 142, /* -Os */

作为奖励,虽然我们在OPT_O里面的OPT_O,我们注意到这些线路:

-optimize

Common Alias(O)

它告诉我们OPT_O(双击,因为它以opts.c:default_options_table文件中的短划线O开头)是-O的无证别名,可以用作--optimize=3!

使用OPT_O的地方

现在我们grep:

git grep -E '\bOPT_O\b'

这指向我们两个文件:

opts.c

LTO-wrapper.c

我们先来追踪OPT_O

opts.c:default_options_optimization

所有OPT_O用法发生在:O。

我们回溯看看谁调用了这个函数,我们看到唯一的代码路径是:

OPT_O

OPT_O

OPT_O

OPT_O

和OPT_O是O的切入点。好!

这个功能的第一部分:

OPT_O在对应于opts.c:default_options_table的字符串上调用O来解析输入参数

将值存储在OPT_O中,其中O是opts.c:default_options_table。

struct gcc_opts

在徒劳地贪图之后,我们注意到这个OPT_O也生成于O:

struct gcc_options {

int x_optimize;

[...]

}

其中OPT_O来自以下行:

Variable

int optimize

目前在OPT_O,和O:

struct gcc_options global_options;

所以我们猜测这是包含整个配置全局状态的,OPT_O是优化值。

255是内部最大值

在OPT_O,O中应用于输入参数,因此opts.c:default_options_table是上限。 如果你把任何更大的东西,似乎GCC运行C未定义的行为。 哎哟?

OPT_O也会精简包装O,如果任何字符不是数字,则拒绝该参数。 所以负值优雅地失败了。

回到OPT_O,我们看到了这一行:

if ((unsigned int) opts->x_optimize > 255)

opts->x_optimize = 255;

所以优化级别被截断为OPT_O.在阅读O时,我遇到过:

# All of the optimization switches gathered together so they can be saved and restored.

# This will allow attribute((cold)) to turn on space optimization.

并在生成的OPT_O上:

struct GTY(()) cl_optimization

{

unsigned char x_optimize;

这解释了为什么截断:选项也必须转发到OPT_O,它使用O来节省空间。 所以255实际上是一个内部最大值。

opts.c:maybe_default_options

返回OPT_O,我们看到O,听起来很有趣。 我们输入它,然后我们到达一个大开关的opts.c:default_options_table:

switch (default_opt->levels)

{

[...]

case OPT_LEVELS_1_PLUS:

enabled = (level >= 1);

break;

[...]

case OPT_LEVELS_3_PLUS:

enabled = (level >= 3);

break;

没有OPT_O检查,这表明O是最大可能的。

在O上搜索OPT_O的定义:

enum opt_levels

{

OPT_LEVELS_NONE, /* No levels (mark end of array). */

OPT_LEVELS_ALL, /* All levels (used by targets to disable options

enabled in target-independent code). */

OPT_LEVELS_0_ONLY, /* -O0 only. */

OPT_LEVELS_1_PLUS, /* -O1 and above, including -Os and -Og. */

OPT_LEVELS_1_PLUS_SPEED_ONLY, /* -O1 and above, but not -Os or -Og. */

OPT_LEVELS_1_PLUS_NOT_DEBUG, /* -O1 and above, but not -Og. */

OPT_LEVELS_2_PLUS, /* -O2 and above, including -Os. */

OPT_LEVELS_2_PLUS_SPEED_ONLY, /* -O2 and above, but not -Os or -Og. */

OPT_LEVELS_3_PLUS, /* -O3 and above. */

OPT_LEVELS_3_PLUS_AND_SIZE, /* -O3 and above and -Os. */

OPT_LEVELS_SIZE, /* -Os only. */

OPT_LEVELS_FAST /* -Ofast only. */

};

哈! 这是一个强有力的指标,只有3个级别。

opts.c:default_options_table

OPT_O非常有趣,我们grep O,并且翻译为opts.c:default_options_table:

static const struct default_options default_options_table[] = {

/* -O1 optimizations. */

{ OPT_LEVELS_1_PLUS, OPT_fdefer_pop, NULL, 1 },

[...]

/* -O3 optimizations. */

{ OPT_LEVELS_3_PLUS, OPT_ftree_loop_distribute_patterns, NULL, 1 },

[...]

}

所以这是对文档中提到的特定优化映射进行编码的OPT_O。太好了!

确保x_optimize没有更多用途

OPT_O的主要用途是设置其他特定的优化选项,如手册页中记录的O。 还有吗?

我们OPT_O,并找到更多。 数量很小,经过人工检查,我们发现每次使用最多只能进行O,所以我们的结论是成立的。

LTO-wrapper.c

现在我们去第二次出现OPT_O,这是在O。

LTO意味着链接时间优化,顾名思义它将需要OPT_O选项,并且将链接到O(基本上是链接器)。

事实上,第一行OPT_O说:

/* Wrapper to call lto. Used by collect2 and the linker plugin.

在这个文件中,OPT_O的出现似乎只是将O的值标准化为向前传递,所以我们应该没问题。

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。