在Airflow中设置DB2

时间:2018-11-28 01:32:26

标签: java docker jdbc db2 airflow

我正在尝试将DB2连接为驻留在Docker容器中的气流的数据连接(意识到这并不自然地受到支持)。我正在Mac上进行开发

我添加了连接,如下面的屏幕快照所示,其中URL为host:port / databse。

Screenshot of the JDBC DB2 Connection

然后我要转到“数据分析”>“临时查询”尝试测试连接,然后显示以下内容。

enter image description here

为了确保驱动程序可用,我在docker-compose文件中将jdbc驱动程序所在的文件夹安装到了/ usr / local / airflow / drivers。

我还确保在我的requirements.txt文件中包含以下软件包,因为从jupyter笔记本查询时这些软件包是必需的。

  • sasl
  • thrift_sasl
  • jaydebeapi
  • jpype1
  • ibm_db
  • ibm_db_sa

我无法弄清我所缺少的。

我经历过:

这是我当前的Dockerfile。如评论中所示,Dockerfile中未安装JVM,因此可能是问题所在。

# VERSION 1.10.1
# AUTHOR: Matthieu "Puckel_" Roisil
# DESCRIPTION: Basic Airflow container
# BUILD: docker build --rm -t puckel/docker-airflow .
# SOURCE: https://github.com/puckel/docker-airflow

FROM python:3.6-slim
LABEL maintainer="Puckel_"

# Never prompts the user for choices on installation/configuration of packages
ENV DEBIAN_FRONTEND noninteractive
ENV TERM linux


# Airflow
ARG AIRFLOW_VERSION=1.10.1
ARG AIRFLOW_HOME=/usr/local/airflow
ARG AIRFLOW_DEPS=""
ARG PYTHON_DEPS=""
ENV AIRFLOW_GPL_UNIDECODE yes

# Define en_US.
ENV LANGUAGE en_US.UTF-8
ENV LANG en_US.UTF-8
ENV LC_ALL en_US.UTF-8
ENV LC_CTYPE en_US.UTF-8
ENV LC_MESSAGES en_US.UTF-8

# Java

RUN apt-get update && apt-get install -y openjdk-7-jre-headless wget \
    && apt-get clean 
ENV JAVA_HOME /usr/lib/jvm/java-7-openjdk-amd64

RUN set -ex \
    && buildDeps=' \
        freetds-dev \
        libkrb5-dev \
        libsasl2-dev \
        libssl-dev \
        libffi-dev \
        libpq-dev \
        git \
    ' \
    && apt-get update -yqq \
    && apt-get upgrade -yqq \
    && apt-get install -yqq --no-install-recommends \
        $buildDeps \
        freetds-bin \
        build-essential \
        default-libmysqlclient-dev \
        apt-utils \
        curl \
        rsync \
        netcat \
        locales \
    && sed -i 's/^# en_US.UTF-8 UTF-8$/en_US.UTF-8 UTF-8/g' /etc/locale.gen \
    && locale-gen \
    && update-locale LANG=en_US.UTF-8 LC_ALL=en_US.UTF-8 \
    && useradd -ms /bin/bash -d ${AIRFLOW_HOME} airflow \
    && pip install -U pip setuptools wheel \
    && pip install pytz \
    && pip install pyOpenSSL \
    && pip install ndg-httpsclient \
    && pip install pyasn1 \
    && pip install apache-airflow[crypto,celery,postgres,hive,jdbc,mysql,ssh${AIRFLOW_DEPS:+,}${AIRFLOW_DEPS}]==${AIRFLOW_VERSION} \
    && pip install 'redis>=2.10.5,<3' \
    && if [ -n "${PYTHON_DEPS}" ]; then pip install ${PYTHON_DEPS}; fi \
    && apt-get purge --auto-remove -yqq $buildDeps \


  && apt-get autoremove -yqq --purge \
    && apt-get clean \
    && rm -rf \
        /var/lib/apt/lists/* \
        /tmp/* \
        /var/tmp/* \
        /usr/share/man \
        /usr/share/doc \
        /usr/share/doc-base

COPY script/entrypoint.sh /entrypoint.sh
COPY config/airflow.cfg ${AIRFLOW_HOME}/airflow.cfg
COPY requirements.txt ${AIRFLOW_HOME}/requirements.txt

RUN pip install --upgrade pip && pip install -r requirements.txt
RUN chown -R airflow: ${AIRFLOW_HOME}

EXPOSE 8080 5555 8793

USER airflow
WORKDIR ${AIRFLOW_HOME}
ENTRYPOINT ["/entrypoint.sh"]
CMD ["webserver"] # set default arg for entrypoint

2 个答案:

答案 0 :(得分:1)

jpype1模块需要一个JVM,您可以在$PATH上访问它-尝试安装一个然后再试一次。

答案 1 :(得分:0)

最后弄清楚了。下面是我最终用来安装Java的工具。然后我刚刚在其中安装了驱动程序的文件夹。

autoReconnect: true