author: scruffybear
release time: 29/08/2007
如有转载,请注明出处,并保持文章的完整性,谢谢!
七月份做警务通的项目,涉及到对已有的短信内容进行修改的问题,也就是所说的对COS打补丁修改短信内容的问题,联系本项目在这里对G网短信和C网短信的格式和压缩方法进行简单介绍。1,G网短信的一般格式 G网短信格式完全遵守《GSM03.40规范》,所以很容易通过现有规范对现有短信进行解析。卡片按照《GSM11.14规范》来组织短信,发送短信的command tag为‘13’,SMS TPDU tag为‘0B/8B’,更详细内容请参见该规范,现用一条具体短信解释格式如下: Fetch指令取得短信内容: A01200002FSWD02D81030A130082028183850D8077ED4FE153D190014E2D20268B13010008819494881100080812345678123456789000 Command Details 01/81 03 0A(Command number) 13(command tag) 00(Command Qualifier) 此项是强制的(Mandatory) Device identities 02/82 02 81(SIM) 83(Network) 此项是强制的(Mandatory) Alpha identifier 05/85 0D 8077ED4FE153D190014E2D2026(短信发送中…) 此项应该是可选的(Optional) Address tag 此例中没有,举例:06/86 08FFFFFFFFFFFFFFFF 此项应该是可选的(Optional) SMS TPDU tag 0B/8B 13 01000881949488110008081234567812345678(此项内容在GSM03.40规范中解释) SMS TPDU内容由《GSM03.40规范》进行解释,具体可参见该规范9.2节,Service Provided by the SM-TL(The Short Message Transfer Layer),现仅对具体本条短信的TPDU进行解释,内容如上:0B/8B 13 01000881949488110008081234567812345678,此短信为SUBMIT类型: TP-MTI(TP-Message-Type-Indicator)等, 01,bit1,bit0最低两位为01,表示短信内容为SMS-SUBMIT (in the direction MS to SC),bit4,bit3为00,表示短信中无TP-VP字段:0 0 TP-VP field not present TP-MR(TP-Message-Reference) 00 TPDA(TP-Destination-Address) 088194948811,TPDA的长度为(len+1)/2+1,在本例中,为(8+1)/2+1=5 TP-PID(TP-Protocol-Identifier) 00 TP-DCS(TP-Data-Coding-Scheme) 08 TP-VP(TP-Validity-Period) 此短信中无,该项表示短信的有效期。 TP-UDL+TPUD(TP-User-Data-Length+TP-User-Data) 081234567812345678 注意:TPUDL长度为实现压缩前的长度。 以上说明针对具体短信,更多情况请参照相应规范,在此不赘述。 2,G网短信的压缩及汇编实现 由于补丁中需要对G网短信做压缩,而且不方便调用已有函数,故用汇编实现了G网的短信压缩。 G网短信压缩格式在TP-DCS中指示,TP-DCS在《GSM03.38》中有说明,一般都采用将7bit编码压缩成8bit编码方式,这种压缩方式也在《GSM03.38》中有详细说明。 压缩编码方式将8字节的7bit编码压缩成7字节的8bit编码,也就是说160字节长短信可以压缩为140字节的短信,压缩了20字节,具体压缩方法如下: 原始的8字节未压缩编码如下: - bits number: 6 5 4 3 2 1 0 1a 1b 1c 1d 1e 1f 1g 2a 2b 2c 2d 2e 2f 2g 3a 3b 3c 3d 3e 3f 3g 4a 4b 4c 4d 4e 4f 4g 5a 5b 5c 5d 5e 5f 5g 6a 6b 6c 6d 6e 6f 6g 7a 7b 7c 7d 7e 7f 7g 8a 8b 8c 8d 8e 8f 8g 经过压缩后的8bit编码如下: - eight characters in seven octets: - bits number: 7 6 5 4 3 2 1 0 2g 1a 1b 1c 1d 1e 1f 1g 3f 3g 2a 2b 2c 2d 2e 2f 4e 4f 4g 3a 3b 3c 3d 3e 5d 5e 5f 5g 4a 4b 4c 4d 6c 6d 6e 6f 6g 5a 5b 5c 7b 7c 7d 7e 7f 7g 6a 6b 8a 8b 8c 8d 8e 8f 8g 7a 从以上的压缩方法可以看出,第一个压缩后字节是第一个7bit在最高位加上第二个7bit的最低位,第二个压缩字节是第二个7bit的高六位加上第三个7bit的低两位,依次类推。 第七个压缩后字节(最后一个压缩字节)是第七个7bit的最高位加上整个第八个7bit的七位。这样就实现了将8个字节的7bit编码压缩成7个字节的8bit编码。 举一个具体的例子,字符串3132333435363738是7bit编码,现压缩成8bit编码。 3132333435363738转换为bit为00110001(31) 00110010(32) 00110011(33) 00110100(34) 00110101(35) 00110110(36) 00110111(37) 00111000(38),进行转换,过程如下: a,转换31,32的最低位到31的最高位,可以看到31不变,第一个压缩后字节为31 b,转换32,32由于取了最低位,相当于向右移了一位,为00011001,将33的低两位放在右移一位的31高位上,也就为11011001,即D9。 c,转换33,33由于取了低两位,相当于向右移了两位,为00001100,将34的低三位放在右移两位的33高位上,也就为10001100,即8C。 d,转换34,34由于取了低三位,相当于向右移了三位,为00000110,将35的低四位放在右移三位的34高位上,也就为01010110,即56。 e,转换35,35由于取了低四位,相当于向右移了四位,为00000011,将36的低五位放在右移四位的35高位上,也就为10110011,即B3。 f,转换36,36由于取了低五位,相当于向右移了五位,为00000001,将37的低六位放在右移五位的36高位上,也就为11011101,即DD。 g,转换37,37由于取了低六位,相当于向右移了六位,为00000000,将整个38的七位放在右移六位的37高位上,也就是1110000,即70。 到此7位编码的3132333435363738压缩为了7字节的31D98C56B3DD70,也就是说压缩掉了一字节。 在进行编码实现时,可以将压缩前的短信每8字节为一组进行处理,处理为压缩后的七字节,这样形成外层循环。循环次数为短信长度除以8再向上取整,例如11/8=1, 1+1 = 2,也就是经过两次循环。进行内层循环处理时,需要进行七次循环,循环到n(0 ;DPTR和DPTR1都指向短信开始处,R1中存放外层循环变量,内层循环变量为R2,初始值为1,R3中存放需要转换字符的总长度,并已设置好。 ;实际上每一次内层循环,都是两字节一处理,这里将两字节分别称为第一字节和第二字节。 ;每一次层循环过程是取第二字节的低R2放在第一字节的高R2位上,然后将第二字节右移R2位后作为下一次内层循环的第一字节。 MOVX A, @DPTR MOV R6, A ;在进行第一次处理之前预设R6为第一字节内容。 out_transbegin: ;外层循环开始处,循环[len/8](注意是向上取整)次。 MOV R2, #1 ;进行外层循环之前,需要将内层循环变更R2设置为1 transbegin: ;内层循环开始处,循环7次。 MOV A, R6 ;the 2nd number of last loop as the first number. MOV R5, A ;R5 store the 1st number. INC DPTR MOVX A, @DPTR MOV R6, A ;R6 store 2rd number. MOV R0, A ;将第二个字节存放在R0中,以备后用。 MOV A, R2 ;2*2*...*2(R2个2)-1 MOV R7, A LCALL POWER2 ;POWER2为2的N次方,N从R7传入,POWER2函数实现很简单,这里不列出。 CLR C SUBB A, #01H ;2*2*...*2-1即2的R2次方减一,2exp(R2)-1 ANL A, R6 ; 2nd number & 111...11, 取后一字节的低R2位,例如第一次循环,取最低位。 2exp(1)-1 = 1, 取最低位,如果为2exp(2)-1=3,取最低两位。 MOV R6, A ;R6 store the anl result MOV A, #8 ;计算8-R2,取了第二个字节的低R2位后,再左移(8-R2)位,最后与第一个字节进行或操作。 CLR C SUBB A, R2 ;8-R2 MOV R7, A ;R7是输入参数,即左移次数。 MOV A, R6 ;ANL操作的后再左移(8-R2)位,放在第一个字节的高位。 LCALL LFRotateN ;左位移(8-R2)位,LFRotateN很简单,不列出,结果放在A里。 ORL A, R5 ;进行或操作,将第二个字节的低R2位放在第一个字节的高R2位上。 MOVX @DPTR1, A ;结果存放在DPTR1所指的地方。 MOV A, R2 MOV R7, A ;右移次数。 MOV A, R0 ;前面保存的第二字节在R0中,这里右移R2位,作为下一次循环的第一字节。 LCALL RTRotateN ;右移R2位操作,RTRotateN很简单,不列出,结果放在A里。 MOV R6, A ;R6作为下一次循环的第一字节。 INC DPTR1 ;写指针DPTR1加1 INC R2 ;内层循环变量加1 MOV A, R3 ;R3 is the len CLR C SUBB A, #1 MOV R3, A ;R3也就是转换的总长度减一, R3=R3-1 JZ transend ;如果长度为0,则表示已经处理完所有字节,即出。 CJNE R2, #8, transbegin ;循环范围为1~7 INC DPTR ;outer loop proceed,进入下一次外层循环前的准备工作。 MOVX A, @DPTR MOV R6, A ;进入下一个8字节处理之前预设第一字节为R6 MOV A, R3 ;R3是短信长度,进入下一次处层循环时,R3长度也要减1,处理的是下一个8字节的头两个字节。 CLR C SUBB A, #1 MOV R3, A JZ transend DJNZ R1, out_transbegin ;loop [len/8] times, 如果R1没减到0,则进入到下层循环。 transend: 以上是7bit编码压缩为8bit编码的算法实现。 3 C网短信压缩方法 C网短信按照《中国联通800MHz CDMA数字蜂窝移动通信网UTK技术要求》规范进行组织,现简单地解释一条具体短信内容: A01200003ASWD038810308130082028183850F806B63572853D19001002E002E002EC81C000002100204080B813193612004F7080B000320000001041017FFE09000 这里与G网短信类似,分别为主动式UIM命令标签(13),Alpha标识符(85)(O),设备标识(82),CDMA SMS TPDU(C8) C81C000002100204080B813193612004F7080B000320000001041017FFE09000是CDMA SMS TPDU内容,解析如下: C81C(tag+len) 00 (段消息类型:00 SMS point to point) 00 02 1002 (TAG:teleservice identifier) 04 08 0B813193612004F7 (Destination Address ) 08 0B 00 03 200000 01 04 1017FFE0 (Bearer Data) Bearer Data为080B000320000001041017FFE0,进行拆分, 08 0B(tag+len) 00 03 200000 (Message Identifier ) 01 04 1017FFE0 (User data ) 首先将0104后内容1017FFE0转换为bit:0001 0000 0001 0111 1111 1111 1110 0000 前5bit为编码类型,为00010,表示为7bit编码,进行划分即为:00010 0000001 0111111 11111111 00000 以上仅对具体短信进行分析,更多情况请参考《TIA-EIA-637-A》。 4, 参考文档: 1,GSM11.14 2, GSM03.40 3, GSM03.38 4, 中国联通800MHz CDMA数字蜂窝移动通信网UTK技术要求 5, TIA-EIA-637-A