用二进制来写程序这么反人类的事情,的确是很装的事情,但是它不但是一件很装的事情,也是掌握底层知识的基础能力之一。听我慢慢道来。

 

SRE实战 互联网时代守护先锋,助力企业售后服务体系运筹帷幄!一键直达领取阿里云限量特价优惠。

        程序设计语言有高级语言和低级语言之分,尤其是现在各种编程语言的不断发展,掌握高级程序设计语言的人越来越多。

 

        但是是否可以使用二进制来写程序呢?也许最初使用打孔带来控制机器的人可以完成,那么现在是否仍然有人可以完成呢?答案是肯定的!

 

        计算机可以直接运行的指令是二进制的机器码,所有的代码在运行之前都会变成 CPU 可以识别的二进制。对于编译型的二进制语言,其实都是可以直接使用二进制来写的。

 

        比如,Windows 下使用 C 语言编写的程序编译连接后可以生成一个 .exe 的可执行程序,生成的这个可执行程序就是一个二进制程序。那么,这个程序如何用二进制编写呢?

 

        先来考虑几个问题!

 

        首先,可执行程序中并非只有代码,而 CPU 要执行的只有代码。

 

        其次,CPU 执行的代码是二进制,但是在内存中的数据也是二进制数据,那么如何知道哪部分是代码,哪部分是数据呢?这是操作系统在加载程序文件进入内存时,操作系统按照一定规则把不同二进制按照不同的属性装入了不同的内存分页当中,并对内存设置相应的属性。

 

        最后,操作系统如何知道程序文件中的二进制哪部分是数据,哪部分是代码呢?这是在程序被编译连接时不但把代码和代码所需的数据编译到了程序中,还把管理代码的数据也放入了程序中,而这部分管理数据决定了哪部分是数据哪部分是代码。

 

        因此,用二进制写代码就需要至少掌握两方面,一方面是了解可执行程序的管理数据,另一方面就是了解 CPU 的机器码。

 

        在 Windows 下的可执行程序是 PE 格式的,那么就要了解 PE 格式的数据结构,和 CPU 的机器码;在安卓下的可执行程序中,其格式是 DEX 格式,那么就要了解 DEX 格式的数据结构,以及安卓虚拟机的字节码(这个字节码不是 CPU 的机器码,DEX 的字节码最终被虚拟机解释成机器码,因此手写 DEX 文件时了解 DEX 格式和其字节码即可),同样的,Java 编译的 Class 文件也和安卓相同,因为它也是基于虚拟机执行的文件。其中 PE 格式和 DEX 格式就是程序的管理数据,用于告诉操作系统或虚拟机,整个文件中代码、数据以及其他资源在文件中的结构。

 

        因为二进制的阅读性比较差,因此人们使用了八进制十六进制四位二进制可以表示为一位十六进制,由于系统是 32 位或 64 位,那么刚好使用 8 个十六进制位表示 32 个二进制位,或者 16 个十六进制位表示 64 个二进制位。因此,在内存中查看数据时,更多的是使用十六进制,其实从本质上十六进制和二进制是没有区别的,只是表示的方式不同。因此,真正使用二进制来写程序时,是使用十六进制来完成的。

 

        那么,在使用十六进制来编写 Windows 下的可执行程序时,首先需要使用十六进制编辑器构造 PE 文件结构,PE 文件结构主要告诉操作系统,程序加载入内存后,程序的映射起始地址是多少,程序的入口地址是多少,程序中的代码和数据分别保存在哪里,以及它们的长度是多少,映射到内存中以后其地址是多少,该可执行文件调用了哪些系统函数,这些系统函数分别在哪些动态链接库中等信息。构造完 PE 文件结构以后,就可以使用机器码来写程序了。只要把机器代码写到 PE 文件结构中标识程序入口的位置处就行了。当然了,机器码写程序是比较困难的,但是作为学习底层基础知识来说,写一个简单的程序还是可以的,比如写一个弹出对话框的“hello world”这样的程序。用机器码写这样的程序,也无需了解太多的知识,有一份 Opcode 的手册就可以了。

 

        这就是如何用十六进制编辑器来完成一个可执行程序的过程,关于 PE 文件格式,可以参考 MSDN 或网上的文章,对于学习机器码相关的知识可以查看 Intel 的指令手册。学习这些知识对于软件破解、病毒分析、加密解密、内核驱动开发等是相应知识的基础,感兴趣的可以了解一下,了解这些知识绝对不仅仅是用来装 X 的。

 

 

我的微信公众号:“码农UP2U”

 用二进制写程序,提升装 X 境界 Safe

 

扫码关注我们
微信号:SRE实战
拒绝背锅 运筹帷幄