Multi-Channel AI-Tutor with Memory

Erstellt

2025-10-29 - Tobias Waggoner

Vision in einem Satz

Ein AI-Tutor, der über Web-UI und Discord erreichbar ist, sich an jeden User individuell erinnert und dessen Persönlichkeit im Dialog anpassbar ist - ohne ein einziges Formular.

Zielgruppe & Motivation

Primäre Nutzer: Entwickler-Team + 2-3 Freunde von Tim/Michi (erste Tester)
Motivationale Treiber:
"Cooler als ChatGPT" - etwas, das sich persönlich anfühlt
Niedrigschwelliger Einstieg: Dort chatten, wo man eh schon ist (Discord)
Der Bot passt sich an - nicht der User an den Bot

Beschreibung

User Journey: Erste Interaktion

Alex, 16 Jahre, loggt sich das erste Mal ein (Web-UI oder Discord):

Erster Kontakt:
Der Bot startet neutral und freundlich
Im natürlichen Gesprächsfluss fragt er: "Wie soll ich eigentlich mit dir reden? Eher locker wie ein Kumpel, sachlich wie ein Coach, oder gemeinsam am lernen?"
Alex antwortet im Dialog - keine Dropdown, kein Formular
Der Bot wählt daraufhin eine von 3-4 Default-Personalities als Startpunkt
Erste Gespräche:
Alex chattet mit dem Bot über beliebige Themen (noch kein Schul-Fokus)
Im Flow stellt der Bot gelegentlich Profil-Fragen (Name, Alter, Interessen) - nur wenn es passt
Alex kann jederzeit sagen "kein Bock auf Fragen" → Bot stoppt für diese Session
Personality-Anpassung:
Alex sagt im Chat: "Kannst du bitte lockerer sein?"
Bot erkennt die Anfrage via Tool-Call
Im Hintergrund: LLM-Call passt den Personality-Prompt an (mit Guardrails)
Bot antwortet direkt in neuem Stil
Memory in Action:
Alex chattet montags im Web-UI, mittwochs auf Discord
Der Bot erinnert sich: "Hey, wir hatten neulich über [X] geredet - willst du da weiter machen?"
Zwischen den Sessions: Bot "denkt nach" (asynchroner Prozess) und bereitet Themen-Hints für das nächste Gespräch vor
Channel-Awareness:
Auf Discord: Bot ist lockerer, nutzt Emojis, bietet Reactions als Quick Actions (👍 = next, 🤔 = mehr Details)
Im Web-UI: Bot ist strukturierter, formatiert Antworten klarer

Kern-Features

1. Multi-Channel-Chat

User kann über Web-UI oder Discord mit dem Bot chatten
Gleicher Bot, gleiches Memory, verschiedene Kanäle
User-Identifikation über Authentifizierung (Discord-User ↔ Web-User Mapping)

2. Conversation Memory

Simples Log (Datei oder DB) speichert alle Gespräche pro User
Bot "erinnert" sich an vorherige Chats
Memory funktioniert kanalübergreifend

3. AI-First Personality-Customizing

Keine UI-Formulare - alles im Dialog
User sagt: "Sei lockerer" → Bot passt sich an
Technisch: Tool-Call erkennt Anpassungswunsch → zweiter LLM-Call schreibt neuen Personality-Prompt (mit Guardrails)
User darf den Bot "kaputt-prompten" (Early Stage = Vertrauen in Tester)

4. Natürliches Onboarding

Kein festes Onboarding-Script
Bot stellt Profil-Fragen (Name, Alter, Interessen, Präferenzen) im natürlichen Gesprächsfluss
User kann ablehnen → Bot fragt in dieser Session nicht weiter
Profil-Struktur: JSON/YAML (Details offen)

5. Default-Personality-Auswahl

Beim ersten Chat: Bot fragt im Dialog, welcher Stil passt
3-4 Default-Personalities als Startpunkt (z.B. "Kumpel", "Coach", "Entdecker")
Diese wird später vom User weiter customized

6. Channel-spezifisches Prompting

Discord: Lockerer Ton, Emojis, Reactions (👍🤔📝) als Quick Actions
Web-UI: Strukturierter, formatiert, klarer
Automatisch per Code injected (kein User-Setting)

7. Asynchroner Hintergrund-Denkprozess

Bot "denkt nach", wenn User offline ist
Überlegt sich Themen für das nächste Gespräch
Hints werden beim nächsten Login in System-Prompt injected
Trigger: Nach jedem Chat (zeitgesteuert oder Flag-basiert)

Technisches Fundament (grob)

Keine komplexen Agents: Nur Chat + Memory Log
Kein Web-Zugriff: Nur LLM-Calls
Tool-Calling: Für Personality-Anpassung, Discord Reactions
Simple Architektur: Conversation Log (Datei oder DB), User-Profil (JSON/YAML)

Was NICHT im Scope ist

❌ Slash-Commands (z.B. /show-prompt)
❌ Gamification (Streaks, XP, Achievements)
❌ Auto-Summaries nach jedem Chat
❌ Mini-Challenges
❌ Lern-Content / Schul-Bezug (kommt später)
❌ Komplexe UI-Features (alles AI-first im Dialog)

Nächste Schritte

[ ] Entscheidung: 3-4 Default-Personalities definieren (konkrete Prompts)
[ ] Entscheidung: Profil-Fragen festlegen (welche Kern-Infos braucht der Bot?)
[ ] Architektur: Tech-Stack klären (Backend, Discord-Bot-Framework, Memory-Storage)
[ ] Design: Erste Web-UI-Skizzen (minimalistisch, Chat-fokussiert)
[ ] Bereit für: Stock (sobald Architektur-Entscheidungen getroffen sind)

Status: Ready to Forge 🔨