Celery 简介
Celery简介
任务队列一般用于线程或计算机之间分配工作的一种机制。
任务队列的输入是一个称为任务的工作单元,有专门的职程(Worker)进行不断的监视任务队列,进行执行新的任务工作。
Celery 通过消息机制进行通信,通常使用中间人(Broker)作为客户端和职程(Worker)调节。启动一个任务,客户端向消息队列发送一条消息,然后中间人(Broker)将消息传递给一个职程(Worker),最后由职程(Worker)进行执行中间人(Broker)分配的任务。
Celery 可以有多个职程(Worker)和中间人(Broker),用来提高Celery的高可用性以及横向扩展能力。
可以通过暴露 HTTP 的方式进行,任务交互以及其它语言的集成开发。
Celery 需要消息中间件来进行发送和接收消息。 RabbitMQ 和 Redis 中间人的功能比较齐全,但也支持其它的实验性的解决方案,其中包括 SQLite 进行本地开发。
Celery 可以在一台机器上运行,也可以在多台机器上运行,甚至可以跨数据中心运行。
Celery 4.0 运行:
- Python ❨2.7,3.4,3.5❩
- PyPy ❨5.4,5.5❩
这是支持 Python2.7 的最后一个版本,从下一个版本Celery5.x开始,需要Python3.5或更高的版本。
如果您的 Python 运行环境比较老,则需要使用旧版本的Celery:
- Python 2.6:Celery 3.1 或更早版本。
- Python 2.5:Celery 3.0 或更早版本。
- Python 2.4:Celery 2.2 或更早版本。
Celery 是一个资金最少的项目,因此我们不支持 Microsoft Windows。请不要提出与该平台相关的任何问题。
如果您是第一次使用 Celery,或您使用的是 3.1 之前的版本,建议您阅读入门教程:
- 简单
Celery 上手比较简单,不需要配置文件就可以直接运行。
这是一个简单的 Demo:
from celery import Celery
app = Celery('hello', broker='amqp://[email protected]//')
@app.task
def hello():
return 'hello world'
- 高可用
如果出现丢失连接或连接失败,职程(Worker)和客户端会自动重试,并且中间人通过 主/主 主/从 的方式来进行提高可用性。
- 快速
单个 Celery 进行每分钟可以处理数以百万的任务,而且延迟仅为亚毫秒(使用 RabbitMQ、 librabbitmq 在优化过后)。
- 灵活
Celery 的每个部分几乎都可以自定义扩展和单独使用,例如自定义连接池、序列化方式、压缩方式、日志记录方式、任务调度、生产者、消费者、中间人(Broker)等。
- 中间人
- 结果存储
- AMQP、 Redis
- Memcached
- SQLAlchemy、Django ORM
- Apache Cassandra、Elasticsearch
- 序列化
- pickle、json、yaml、msgpack
- zlib、bzip2 compression
- Cryptographic message signing
- 监控
- 调度
可以通过调度功能在一段时间内指定任务的执行时间 datetime,也可以根据简单每隔一段时间进行执行重复的任务,支持分钟、小时、星期几,也支持某一天或某一年的Crontab表达式。更多......
- 工作流
可以通过“canvas“进行组成工作流,其中包含分组、链接、分块等等。
简单和复杂的工作流程可以使用一组“canvas“组成,其中包含分组、链接、分块等。更多......
- 资源(内存)泄漏保护
--max-tasks-per-child 参数适用于可能会出现资源泄漏(例如:内存泄漏)的任务。更多......
- 时间和速率的限制
您可以控制每秒/分钟/小时执行任务的次数,或者任务执行的最长时间,也将这些设置为默认值,针对特定的任务或程序进行定制化配置。更多......
- 自定义组件
开发者可以定制化每一个职程(Worker)以及额外的组件。职程(Worker)是用 “bootsteps” 构建的-一个依赖关系图,可以对职程(Worker)的内部进行细粒度控制。
Celery可以快速的集成一些常用的Web框架,详细如下:
Web框架 | 集成包 |
不需要 | |
集成包并不是必须安全的,但使用它们可以更加快速和方便的开发,有时它们会在 fork(2) 中添加例如数据库关闭连接的回调。
您可以通过 python 的 pip 安装或通过源代码进行安装 Celery 。
使用pip进行安装
$ pip install -U Celery
Celery 自定义了一组用于安装 Celery 和特定功能的依赖。
您可以在中括号加入您需要依赖,并可以通过逗号分割需要安装的多个依赖包。
$ pip install "celery[librabbitmq]"
$ pip install "celery[librabbitmq,redis,auth,msgpack]"
目前发行的依赖包如下:
- celery[auth]:使用auth保证程序的安全
- celery[msgpack]:使用msgpack序列化
- celery[yaml]:使用yaml序列化
并发
传输和后端
- celery[librabbitmq]:使用librabbitmq库
- celery[redis]:使用Redis进行消息传输或后端结果存储
- celery[sqs]:使用Amazon SQS进行消息传输(实验阶段)
- celery[tblib]:使用 task_remote_tracebacks 的功能
- celery[pymemcache]:使用Memcached作为后端结果存储(纯Python实现)
- celery[cassandra]:使用Apache Cassandra作为后端结果存储
- celery[couchbase]:使用CouchBase作为后端结果存储
- celery[arangodb]:使用ArangoDB作为后端结果存储
- celery[elasticsearch]:使用ElasticSearch作为后端结果存储
- celery[riak]:使用Riak作为后端结果存储
- celery[dynamodb]:使用AWS DynamoDB作为后端结果存储
- celery[zookeeper]:使用Zookeeper进行消息传输
- celery[sqlalchemy]:使用SQLlchemy作为后端结果存储(支持)
- celery[pyro]:使用Pyro4进行消息传输(实验阶段)
- celery[slmq]:使用 SoftLayer Message Queue进行消息传输(实验阶段)
- celery[consul]:使用Consul.io Key/Value进行存储传输消息或后端结果存储(实验阶段)
- celery[django]:支持比较低的Django版本,不建议您在项目中使用它,它仅供参考
从 pypi 下载最新版本的 Celery :
celery
PyPI
PyPI Celery
您可以通过执行以下命令来进行安装
$ tar xvfz celery-0.0.0.tar.gz
$ cd celery-0.0.0
$ python setup.py build
# python setup.py install
如果您没有安装 virtualenv ,最后安装的命令必须使用管理员权限进行安装。
您可以通过 pip 来进行安装:
$ pip install https://github.com/celery/celery/zipball/master#egg=celery
$ pip install https://github.com/celery/billiard/zipball/master#egg=billiard
$ pip install https://github.com/celery/py-amqp/zipball/master#egg=amqp
$ pip install https://github.com/celery/kombu/zipball/master#egg=kombu
$ pip install https://github.com/celery/vine/zipball/master#egg=vine
Last modified 2yr ago