Python celery：分布式异步任务队列实战

昨天 5611阅读

一、引言

在当今数字化时代，许多应用程序都面临着处理大量任务的挑战。这些任务可能需要耗费较长时间，并且在处理过程中可能会阻塞主线程，影响应用程序的响应性能。为了解决这些问题，分布式异步任务队列应运而生。Python celery 就是这样一个强大的分布式异步任务队列框架，它能够有效地管理和执行任务，提高应用程序的效率和响应能力。

二、celery 简介

Celery 是一个基于 Python 开发的分布式异步任务队列框架。它使用消息队列来传递任务消息，并通过 worker 进程来执行任务。Celery 的优点在于它的简单易用、高度可扩展以及对多种消息队列的支持，如 RabbitMQ、Redis 等。

三、实战步骤

（一）安装 celery

首先，确保你已经安装了 Python。然后，使用 pip 安装 celery：

Python celery：分布式异步任务队列实战

pip install celery

（二）创建任务

创建一个 Python 文件，例如 tasks.py，定义你的任务函数。

from celery import Celery

app = Celery('tasks', broker='redis://localhost:6379/0')

@app.task
def add(x, y):
    return x + y

这里定义了一个简单的加法任务 add，使用 Redis 作为消息代理。

（三）启动 worker

在终端中启动 worker 来执行任务。

celery -A tasks worker --loglevel=info

这将启动一个 worker 进程，监听任务队列并执行任务。

（四）发送任务

在另一个 Python 文件中，或者交互式环境中，发送任务到队列。

from tasks import add

result = add.delay(4, 4)
print(result.get())

delay 方法用于异步发送任务，get 方法用于获取任务结果。

四、分布式实战

（一）配置多个 worker

在不同的机器或同一机器的不同终端上，分别启动多个 worker。

celery -A tasks worker --loglevel=info -n worker1@%h
celery -A tasks worker --loglevel=info -n worker2@%h

这里 -n 参数用于指定 worker 的名称，方便区分。

（二）任务分配

当有多个 worker 时，celery 会自动将任务分配到各个 worker 上执行，实现分布式处理。

五、进阶应用

（一）任务重试

@app.task(bind=True, default_retry_delay=300)
def some_task(self, x, y):
    try:
        # 可能会失败的任务逻辑
        result = x + y
    except Exception as exc:
        self.retry(exc=exc)
    return result

通过 bind=True 和 retry 方法实现任务重试。

（二）任务定时执行

from celery.schedules import crontab

app.conf.beat_schedule = {
    'add-every-30-seconds': {
        'task': 'tasks.add',
      'schedule': 30.0,
        'args': (16, 16)
    },
}

使用 beat_schedule 配置定时任务。

六、总结与建议

Python celery 为我们提供了强大的分布式异步任务队列解决方案。通过合理使用 celery，我们可以将耗时任务异步处理，提高应用程序的性能和响应速度。在实际应用中，建议根据任务的特点和需求，选择合适的消息队列和配置参数。同时，要注意任务的错误处理和监控，确保任务的稳定运行。对于复杂的任务场景，可以进一步探索 celery 的高级特性，如任务链、任务分组等，以实现更灵活和高效的任务处理。总之，掌握 Python celery 的使用，能够为我们的项目开发带来显著的优势。