Přeskočit obsah

Databáze & Data

Přehled

CzechAI spravuje 16M+ datových záznamů v různých databázích - SQLite pro lokální data, PostgreSQL pro produkci a Qdrant pro vektory.


Statistiky dat

2.8M+
Kontaktů
3.4M+
Firem
212M+
RUIAN adres
9,049
RAG vektorů

Databázové systémy

PostgreSQL (Docker)

Databáze Účel
czechai_cockpit Cockpit aplikace
czechai_contacts Kontakty (67M+)
dify Dify platform
dify_plugin Dify pluginy

Připojení:

postgresql://postgres:difyai123456@172.19.0.X:5432/DB_NAME

!!! warning "Docker IP" IP adresa se mění po restartu! Ověřte pomocí:

docker inspect docker-db_postgres-1 | grep IPAddress

SQLite databáze

Soubor Záznamy Účel
stat_realit.db 13,585 Reality inzeráty
companies_master.db 3,482,845 Firmy
MASTER_CONTACTS.db 2,819,063 Osoby
contacts_index.db 6,760,000 Kontakty index
ruian.db 212M+ RUIAN geodata
csu_vdb.db - ČSÚ data
ares_api.db - ARES cache

Qdrant (Vector DB)

Kolekce Vektory Účel
legal 6,464 Právní dokumenty
finance 1,200 Finanční data
reality 1,385 Realitní analýzy

Připojení:

http://localhost:6333


Datové zdroje

Vlastní data

  • Scrapery - 3,160 scraperů, 40+ portálů
  • RUIAN - Kompletní adresní registr
  • Katastr - VFK, DXF mapy
  • ČSÚ - Statistická data

Externí API

Zdroj Typ dat
ARES Firemní data
Justice.cz Insolvence, OR
CUZK Katastr
ČNB Finanční data

Architektura dat

graph TB
    subgraph "Zdroje"
        A[Scrapery]
        B[API]
        C[Importy]
    end

    subgraph "Zpracování"
        D[ETL Pipeline]
        E[Normalizace]
        F[Embedding]
    end

    subgraph "Úložiště"
        G[(PostgreSQL)]
        H[(SQLite)]
        I[(Qdrant)]
    end

    subgraph "Služby"
        J[API]
        K[RAG]
        L[Search]
    end

    A --> D
    B --> D
    C --> D
    D --> E
    E --> G
    E --> H
    E --> F
    F --> I
    G --> J
    H --> J
    I --> K
    I --> L

V této sekci