
一、问题展示下面是问题当时的系统负载如下:我们可以看到40.4%sy正是系统调用负载较高的表现,随即朋友采集了perf如下:接下来朋友采集了pstack给我,我发现大量的线程处于如下状态下:Threa......

一、问题展示
下面是问题当时的系统负载如下:

我们可以看到40.4%sy正是系统调用负载较高的表现,随即朋友采集了perf如下:

接下来朋友采集了pstack给我,我发现大量的线程处于如下状态下:
Thread38(Thread0x7fe57a86f700(LWP67268)):10x0000003dee49df8din_L_lock_2163()from/lib64/_zone_system::gmt_sec_to_TIME(st_mysql_time*,long)const()50x0000000000809ea9inField_temporal_with_date::val_date_temporal()()70x00000000005e7ba7inArg_comparator::compare_datetime()()90x00000000006fc6abinevaluate_join_record(JOIN*,st_join_table*)()110x00000000006fecc1inJOIN::exec()()
我们可以注意一下__tz_convert这正是时区转换的证据。
二、关于timestamp简要说明
timestamp:占用4字节,内部实现是新纪元时间(1970-01-0100:00:00)以来的秒,那么这种格式在展示给用户的时候就需要做必要的时区转换才能得到正确数据。下面我们通过访问ibd文件来查看一下内部表示方法,使用到了我的两个工具innodb和bcview。
timestamp的内部表示
建立一个测试表
mysqlshowvariableslike'%time_zone%';+------------------+--------+|Variable_name|Value|+------------------+--------+|system_time_zone|CST||time_zone|+08:00|+------------------+--------+mysqlcreatetabletmm(dttimestamp);QueryOK,0rowsaffected(0.04sec)mysqlinsertintotmmvalues('2019-01-0101:01:01');QueryOK,1rowaffected(0.00sec)我们来查看一下内部表示如下:
[root@gp1test]date-d@1546275661TueJan101:01:01CST2019
因为我的Linux也是CST+8时区这里数据也和MySQL中显示一样。下面我们调整一下时区再来看看取值如下:
mysqlsettime_zone='+06:00';QueryOK,0rowsaffected(0.00sec)mysqlselect*fromtmm;+---------------------+|dt|+---------------------+|2018-12-3123:01:01|+---------------------+1rowinset(0.01sec)
这里可以看到减去了2个小时,因为我的时区从+8变为了+6。
三、timestap转换
在进行新纪元时间(1970-01-0100:00:00)以来的秒到实际时间之间转换的时候MySQL根据参数time_zone的设置有两种选择:
time_zone设置为SYSTEM的话:使用sys_time_zone获取的OS会话时区,同时使用OSAPI进行转换。对应转换函数Time_zone_system::gmt_sec_to_TIME
time_zone设置为实际的时区的话:比如‘+08:00’,那么使用使用MySQL自己的方法进行转换。对应转换函数Time_zone_offset::gmt_sec_to_TIME
实际上Time_zone_system和Time_zone_offset均继承于Time_zone类,并且实现了Time_zone类的虚函数进行了重写,因此上层调用都是Time_zone::gmt_sec_to_TIME。
注意这种转换操作是每行符合条件的数据都需要转换的。
四、问题修复方案
我们从问题栈帧来看这个故障使用的是Time_zone_system::gmt_sec_to_TIME函数进行转换的,因此可以考虑如下:
time_zone:设置为指定的时区,比如‘+08:00’。这样就不会使用OSAPI进行转换了,而转为MySQL自己的内部实现调用Time_zone_offset::gmt_sec_to_TIME函数。但是需要注意的是,如果使用MySQL自己的实现那么us%会加剧。
使用datetime代替timestamp,新版本datetime为5个字节,只比timestamp多一个字节。
五、修复前后
sy%使用量对比据朋友说他大概在上午11点多完成了修改,做的方式是将time_zone修改为‘+08:00’,下面展示修改前后CPU使用率的对比:
修复前:

修复后:

六、备用栈帧
time_zone=‘SYSTEM’转换栈帧
10x0000000000f6b65cinTime_zone::gmt_sec_to_TIME(this=0x2e76948,tmp=0x7fffec0f3ff0,tv=)at/root/mysqlall//sql/:6030x0000000000f4ff49inField_temporal_with_date::val_str(this=0x7ffe7ca66540,val_buffer=0x7fffec0f4370,val_ptr=0x7fffec0f4370)at/root/mysqlall//sql/:542950x0000000000f4549dinField::s_text(this=0x7ffe7ca66540,protocol=0x7ffe7c001e88)at/root/mysqlall//sql/:172570x0000000000fb06c0inItem_field::s(this=0x7ffe7c006ec0,protocol=0x7ffe7c001e88,buffer=0x7fffec0f4760)at/root/mysqlall//sql/:780190x0000000001565758inQuery_result_s::s_data(this=0x7ffe7c006e98,items=)at/root/mysqlall//sql/sql_:2932110x0000000001582059inevaluate_join_record(join=0x7ffe7c007078,qep_tab=0x7ffe7c007758)
time_zone=‘+08:00’转换栈帧
10x0000000000f6b65cinTime_zone::gmt_sec_to_TIME(this=0x6723d90,tmp=0x7fffec0f3ff0,tv=)at/root/mysqlall//sql/:6030x0000000000f4ff49inField_temporal_with_date::val_str(this=0x7ffe7ca66540,val_buffer=0x7fffec0f4370,val_ptr=0x7fffec0f4370)at/root/mysqlall//sql/:542950x0000000000f4549dinField::s_text(this=0x7ffe7ca66540,protocol=0x7ffe7c001e88)at/root/mysqlall//sql/:172570x0000000000fb06c0inItem_field::s(this=0x7ffe7c006ec0,protocol=0x7ffe7c001e88,buffer=0x7fffec0f4760)at/root/mysqlall//sql/:780190x0000000001565758inQuery_result_s::s_data(this=0x7ffe7c006e98,items=)at/root/mysqlall//sql/sql_:2932110x0000000001582059inevaluate_join_record(join=0x7ffe7c007078,qep_tab=0x7ffe7c007758)