浅谈python和C语言混编的几种方式(推荐)
作者:窗户 发布时间:2021-11-30 02:48:51
Python这些年风头一直很盛,占据了很多领域的位置,Web、大数据、人工智能、运维均有它的身影,甚至图形界面做的也很顺,乃至full-stack这个词语刚出来的时候,似乎就是为了描述它。
Python虽有GIL的问题导致多线程无法充分利用多核,但后来的multiprocess可以从多进程的角度来利用多核,甚至affinity可以绑定具体的CPU核,这个问题也算得到解决。虽基本为全栈语言,但有的时候为了效率,可能还是会去考虑和C语言混编。混编是计算机里一个不可回避的话题,涉及的东西很多,技术、架构、团队情况、管理、客户等各个环节可能对其都有影响,混编这个问题我想到时候再开一贴专门讨论。本文只讲python和C混编的方式,大致有如下几种方式(本文背景是linux,其他平台可以类比):
共享库
使用C语言编译产生共享库,然后python使用ctype库里的cdll来打开共享库。
举例如下,C语言代码为
/* func.c */int func(int a)
{
return a*a;
}
python代码为
#!/usr/bin/env python
#test_so.pyfrom ctypes import cdll
import os
p = os.getcwd() + '/libfunc.so'
f = cdll.LoadLibrary(p)
print f.func(99)
测试如下
$ gcc -fPIC -shared func.c -o libfunc.so
$ ./test_so.py
9801
subprocess
C语言设计一个完整的可执行文件,然后python通过subprocess来执行该可执行文件,本质上是fork+execve。
举例如下,C语言代码为
/* test.c */
#include <stdio.h>
int func(int a)
{
return a*a;
}
int main(int argc, char **argv)
{
int x;
sscanf(argv[1], "%d", &x);
printf("%d\n", func(x));
return 0;
}
Python代码为
#!/usr/bin/env python
# test_subprocess.py
import os
import subprocess
subprocess.call([os.getcwd()+'/a.out', '99'])
测试如下
$ gcc test.c -o a.out
$ ./test_subprocess.py
9801
C语言中运行python程序
C语言使用popen/system或者直接以系统调用级fork+exec来运行python程序也是一种混编的手段了。
举例如下,Python代码如下
#!/usr/bin/env python
# test.py
import sys
x = int(sys.argv[1])
print x*x
C语言代码如下
/* test.c */
#include <stdio.h>
#include <stdlib.h>
int main()
{
FILE *f;
char s[1024];
int ret;
f = popen("./test.py 99", "r");
while((ret=fread(s,1,1024,f))>0) {
fwrite(s,1,ret,stdout);
}
fclose(f);
return 0;
}
测试如下
$ gcc test.c
$ ./a.out
9801
python对C语言扩展的支持
很多编程语言都为C语言扩展添加了支持,这有两种原因:(1)语言设计之初,可以充分的利用C语言已有的库来做很多扩展;(2)C语言的运行效率高。
python也不例外,从诞生那天起,很多库都是C语言写的。python的C语言扩展中涉及到python的数据结构与C语言的对应,扩展方法其实是用C语言编写一个共享库,只是这个共享库中的接口是一个规范的,可以被python识别的。
为了说明如何扩展,我这里先假设一个在python下的函数功能,代码如下
def func(*a):
res=1
for i in range(len(a)):
res *= sum(a[i])
return res
如上,希望的函数功能是,参数是任意多个数字组成的列表(姑且排除其他数据结构),返回每个列表的元素之和的乘积。
姑且先把python代码写了,如下所示
#!/usr/bin/env python
# test.py
import colin
def func(*a):
res=1
for i in range(len(a)):
res *= sum(a[i])
return res
a = [1,2,3]
b = [4,5,6]
c = [7,8]
d = [9]
e = [10,11,12,13,14]
f = colin.func2(99)
g = colin.func3(a,b,c,d,e)
h = func3(a,b,c,d,e)
print "f = ",f
print "g = ",g
print "h = ",h
带上之前一直测试的平方func,这个实现相对简单,希望python写出来的func可以和C语言扩展出来的结果一致。
先用C语言写上这些函数的实现,其中func3用上了一个表示任意多个任意长的数组的数据结构y_t,而x_t用来表示单个数组。
/* colin.h */
#ifndef Colin_h
#define Colin_h
typedef struct {
int *a;
int len;
} x_t;
typedef struct {
x_t *ax;
int len;
} y_t;
int func2(int a);
int func3(y_t *p);
void free_y_t(y_t *p);
#endif
/* colin.c */
#include "colin.h"
#include <stdlib.h>
int func2(int a)
{
return a*a;
}
int func3(y_t *p)
{
int result;
int sum;
int i, j;
result = 1;
for(i=0;i<p->len;i++) {
sum = 0;
for(j=0;j<p->ax[i].len;j++)
sum += p->ax[i].a[j];
result *= sum;
}
return result;
}
void free_y_t(y_t *p)
{
int i;
for(i=0;i<p->len;i++) {
free(p->ax[i].a);
}
free(p->ax);
}
上面定义了三个函数,func2代表平方,func3代表之前所说的功能,又因y_t这个结构可能都是动态分配出来的,所以给个归还内存的方法。
刚才说过python扩展的话,需要把这个共享库的接口“标准化”一下。于是我们就包装一下,并给个python加载的入口。
/* wrap.c */
#include <Python.h>
#include <stdlib.h>
#include "colin.h"
PyObject* wrap_func2(PyObject* self, PyObject* args)
{
int n, result;
/* 从参数列表中导出一个整形,用"i" */
if (!PyArg_ParseTuple(args, "i", &n))
return NULL;
/* 用C语言的库实现来计算 */
result = func2(n);
/* 计算结果必须要导成python识别的类型 */
return Py_BuildValue("i", result);
}
PyObject* wrap_func3(PyObject* self, PyObject* args)
{
int n, result;
int i, j;
int size, size2;
PyObject *p,*q;
y_t *y;
y = malloc(sizeof(y_t));
/* 先数数有多少个参数,也就是列表的个数 */
size = PyTuple_Size(args);
/* 把数组的个数先分配了 */
y->len = size;
y->ax = malloc(sizeof(x_t)*size);
/* 遍历python里各个列表(参数) */
for(i=0;i<size;i++) {
/* 先获得第i个参数,是一个列表 */
p = PyTuple_GetItem(args, i);
/* 获得列表的长度 */
size2 = PyList_Size(p);
/* 为数组分配好空间 */
y->ax[i].len = size2;
y->ax[i].a = malloc(sizeof(int)*size2);
/* 遍历列表,依次把列表里的数转到数组里 */
for(j=0;j<size2;j++) {
q = PyList_GetItem(p, j);
PyArg_Parse(q,"i",&y->ax[i].a[j]);
}
}
/* 用C语言的库实现来计算 */
result = func3(y);
free_y_t(y);
free(y);
/* 结果转成python识别格式 */
return Py_BuildValue("i", result);
}
/* 这是接口列表,加载时是只加载此列表的地址,所以这个数据结构不能放栈(局部变量)内,会被清掉 */
static PyMethodDef colinMethods[] =
{
{"func2", wrap_func2, METH_VARARGS, "Just a test"},
{"func3", wrap_func3, METH_VARARGS, "Just a test"},
{NULL, NULL, METH_NOARGS, NULL}
};
/* python加载的时候的接口 */
/* 注意,既然库名叫colin,此函数必须交initcolin */
void initcolin()
{
PyObject *m;
m = Py_InitModule("colin", colinMethods);
}
过程中,我猜测PyArg_VaParse应该功能更为强大,可是反复测没有成功,也没细看文档。
测试一下
$ gcc -I /usr/include/python2.7/ -fPIC -shared colin.c wrap.c -o colin.so
$ ./test.py
f = 9801
g = 729000
h = 729000
可以看到,C语言写的函数和python写的函数结果一致。
来源:http://www.cnblogs.com/Colin-Cai/archive/2017/09/26/7594551.html


猜你喜欢
- 在学习飞机大战(我也不知道为什么都拿这个练手),飞机左右控制都是按键按一次移动一次,不能按住一个键后持续移动,离开后停止移动。为了解决这个,
- 前言python号称是编程界的万金油,那么是否可以做个读取电脑网卡wifi并暴力破解的小脚本呢?在这个基础上为了方便体验是不是可以将其打包成
- 背景我们经常调侃程序员每天都在写bug,这确实是事实,没有测出bug不代表程序就真的不存在问题。传统的代码review、静态分析、人工测试和
- 自从web2.0之后,网页设计开始走向实用设计的阶段,越来越多的设计师注意到“为表达信息而设计”。着迷于前段时间黑白灰老师给大家介绍的“in
- 为什么是三谈为什么是三谈呢?一是因为这真的是一个被说烂的话题,二是因为太师傅在n年前就写过这篇再谈iframe自适应高度。之所以再提该问题,
- 修改数据库字符集:ALTER DATABASE db_name DEFAULT CHARACTER SET character_name [
- 远程服务器配置可以使得数据库管理员在服务器以外的主机上连接到一个SQL Server实例,以便管理员在没有建立单据连接的情况下在其他的SQL
- 最近我遇到了一个 bug,我试着通过 Rails 在以“utf8”编码的 MariaDB 中保存一个 UTF-8 字符串,然后出现了一个离奇
- HTML代码如下,其中,要拖动的div为最外层的div <div id="dialog_createUserGroup&qu
- 本文实例讲述了Python机器学习算法库scikit-learn学习之决策树实现方法。分享给大家供大家参考,具体如下:决策树决策树(DTs)
- 本文实例讲述了Python实现字典排序、按照list中字典的某个key排序的方法。分享给大家供大家参考,具体如下:1.给字典按照value按
- 本文研究的主要是Python编程通过pandas将数据分割成时间跨度相等的数据块的相关内容,具体如下。先上数据,有如下dataframe格式
- 前言本文主要给大家介绍了关于python子类调用父类函数的相关内容,Python中子类中的__init__()函数会覆盖父类的函数,一些情况
- 这篇文章主要介绍了基于python实现把图片转换成素描,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋
- go简单代码反汇编用简单的代码用以分析go的调用约定及多返回值的返回方式。package mainfunc vals(c, d int) (
- 随着编程语言的发展,Go 还很年轻。它于 2009 年 11 月 10 日首次发布。其创建者Robert GriesemerRob Pike
- 今天去辛集买箱包,下午挺晚才回来,又是恶心又是头痛。恶心是因为早上吃坏东西+晕车+回来时看到车祸现场,头痛大概是烈日和空调混合刺激而成。没有
- pyecharts产生背景Echarts是由百度开源的数据可视化,凭借良好的交互性和精巧的图表设计,得到众多开发者的认可,而python很适
- 我介绍了 Systemd 的主要命令,今天介绍如何使用它完成一些基本的任务。一、开机启动对于那些支持 Systemd 的软件,安装的时候,会
- 装饰器(decorator)是一种高级Python语法。装饰器可以对一个函数、方法或者类进行加工。在Python中,我们有多种方法对函数和类