Superset, una alternativa de código abierto a soluciones como Power BI o Looker

Superset es una plataforma de exploración y visualización de datos que puede reemplazar o complementar las herramientas patentadas de inteligencia empresarial para muchos equipos. Esta plataforma se integra bien con una variedad de fuentes de datos y ofrece una serie de características que la hacen atractiva para los desarrolladores y usuarios de código abierto.

Entre las características de Superset se encuentran una interfaz sin código para construir gráficos rápidamente, un poderoso editor SQL basado en web para consultas avanzadas, una capa semántica ligera para definir dimensiones y métricas personalizadas, y soporte listo para usar para casi cualquier base de datos o motor de datos SQL. Además, Superset ofrece una amplia gama de visualizaciones para mostrar los datos, desde simples gráficos de barras hasta visualizaciones geoespaciales.

Características destacadas de Superset

Superset cuenta con una interfaz sin código que permite construir gráficos rápidamente, un poderoso editor SQL basado en web para consultas avanzadas, y una capa semántica ligera para definir dimensiones y métricas personalizadas. Además, ofrece soporte listo para usar para casi cualquier base de datos o motor de datos SQL. Desde simples gráficos de barras hasta visualizaciones geoespaciales, Superset tiene todo lo que necesitas para mostrar tus datos de manera impactante.

Superset puede consultar datos desde cualquier almacén de datos o motor de datos que tenga un controlador DB-API de Python y un dialecto de SQLAlchemy. Algunas de las soluciones de base de datos que se admiten incluyen Redshift, Google BigQuery, Snowflake, Trino, Presto, Databricks, Druid, Firebolt, TimescaleDB, Rockset, PostgreSQL, MySQL, Microsoft SQL Server, DB2, SQLite, Sybase, MariaDB, Vertica, Oracle, Firebird, Greenplum, ClickHouse, Exasol, MonetDB, Apache Kylin, Hologres, Netezza, Pinot, Trafodion, Yugabyte, Databend, Rockset, Doris, OceanBase, Denodo, YDB.

Para agregar soporte para un almacén de datos o motor de datos personalizado, se pueden leer las instrucciones de configuración en la documentación oficial de Superset. Además, se puede encontrar una lista más completa de bases de datos admitidas junto con las instrucciones de configuración en la documentación oficial.

Instalando Superset en un servidor

Para construir Superset desde la fuente, es necesario tener instalado Python 3.6 o 3.7, NodeJS, y el administrador de paquetes de hilo para NodeJS. Primero, se deben instalar las dependencias del sistema operativo. En MacOS, se pueden instalar utilizando el comando brew install pkg-config libffi openssl python, mientras que en Debian/Ubuntu se pueden instalar con sudo apt-get install build-essential libssl-dev libffi-dev python3.6-dev python-pip libsasl2-dev libldap2-dev. En Fedora/RHEL-Derivativ, se pueden instalar con sudo yum upgrade python36u-setuptools y sudo yum install gcc gcc-c++ libffi-devel python36u-devel python36u-pip python-wheel openssl-devel libsasl2-devel openldap-devel.

Una vez que se tienen las dependencias configuradas, se puede clonar el repositorio de Superset utilizando git clone https://github.com/apache/incubator-superset.git y cambiar al directorio del repositorio con cd incubator-superset/. Luego, se crea un entorno virtual con python3 -m venv path/to/new/virtual/env y se activa con source path/to/new/virtual/env/bin/activate. A continuación, se instalan las dependencias con pip install -r requirements.txt y pip install -r requirements-dev.txt.

Superset conectado a Slack es "la autentica salud".
Superset conectado a Slack es «la autentica salud».

Es posible que algunas de las dependencias presentes en requirements.txt generen errores al ejecutar. Para evitarlos, se pueden instalar las dependencias individuales con pip install numpy==1.17, pip install sqlalchemy==1.2.18, pip install pandas==0.23.4, pip install markupsafe==1.0 y pip install mysqlclient. Luego, se puede instalar Superset con pip install -e ., que utiliza el archivo setup.py para instalar la plataforma.

Constuyendo la interfaz de Superset

Para construir la interfaz de usuario de Superset, se debe cambiar al directorio superset/assets/ y ejecutar yarn para descargar y instalar las dependencias de NodeJS. Luego, se puede construir la interfaz de usuario con npm run build. Finalmente, se puede ejecutar Superset con superset run.

También es posible que se encuentren errores durante el proceso de construcción. Algunos de los errores comunes incluyen el error matlask_appbuilder.base: ‘NingunoEl objeto Type’ no tiene atributo ‘name’, que se puede solucionar con superset init y superset db upgrade. Otro error común es el error Fallo al crear virtualenv. virtualenv está instalado con python3.6 pero está utilizando python3.7 para crear venv., que se puede solucionar reinstalando virtualenv para Python 3.7.


Síguenos en redes

No te pierdas ninguna noticia sobre Samsung o tecnología en general, y síguenos en nuestros canales sociales.

Google NewsTwitterFacebookInstagramThreadsTelegram