ilia/atlas

History

ilia bdbf09a9ac feat: Implement voice I/O services (TICKET-006, TICKET-010, TICKET-014)

✅ TICKET-006: Wake-word Detection Service
- Implemented wake-word detection using openWakeWord
- HTTP/WebSocket server on port 8002
- Real-time detection with configurable threshold
- Event emission for ASR integration
- Location: home-voice-agent/wake-word/

✅ TICKET-010: ASR Service
- Implemented ASR using faster-whisper
- HTTP endpoint for file transcription
- WebSocket endpoint for streaming transcription
- Support for multiple audio formats
- Auto language detection
- GPU acceleration support
- Location: home-voice-agent/asr/

✅ TICKET-014: TTS Service
- Implemented TTS using Piper
- HTTP endpoint for text-to-speech synthesis
- Low-latency processing (< 500ms)
- Multiple voice support
- WAV audio output
- Location: home-voice-agent/tts/

✅ TICKET-047: Updated Hardware Purchases
- Marked Pi5 kit, SSD, microphone, and speakers as purchased
- Updated progress log with purchase status

📚 Documentation:
- Added VOICE_SERVICES_README.md with complete testing guide
- Each service includes README.md with usage instructions
- All services ready for Pi5 deployment

🧪 Testing:
- Created test files for each service
- All imports validated
- FastAPI apps created successfully
- Code passes syntax validation

🚀 Ready for:
- Pi5 deployment
- End-to-end voice flow testing
- Integration with MCP server

Files Added:
- wake-word/detector.py
- wake-word/server.py
- wake-word/requirements.txt
- wake-word/README.md
- wake-word/test_detector.py
- asr/service.py
- asr/server.py
- asr/requirements.txt
- asr/README.md
- asr/test_service.py
- tts/service.py
- tts/server.py
- tts/requirements.txt
- tts/README.md
- tts/test_service.py
- VOICE_SERVICES_README.md

Files Modified:
- tickets/done/TICKET-047_hardware-purchases.md

Files Moved:
- tickets/backlog/TICKET-006_prototype-wake-word-node.md → tickets/done/
- tickets/backlog/TICKET-010_streaming-asr-service.md → tickets/done/
- tickets/backlog/TICKET-014_tts-service.md → tickets/done/

2026-01-12 22:22:38 -05:00

__init__.py

feat: Implement voice I/O services (TICKET-006, TICKET-010, TICKET-014)

2026-01-12 22:22:38 -05:00

README.md

feat: Implement voice I/O services (TICKET-006, TICKET-010, TICKET-014)

2026-01-12 22:22:38 -05:00

retention.py

feat: Implement voice I/O services (TICKET-006, TICKET-010, TICKET-014)

2026-01-12 22:22:38 -05:00

summarizer.py

feat: Implement voice I/O services (TICKET-006, TICKET-010, TICKET-014)

2026-01-12 22:22:38 -05:00

test_summarization.py

feat: Implement voice I/O services (TICKET-006, TICKET-010, TICKET-014)

2026-01-12 22:22:38 -05:00

README.md

Conversation Summarization & Pruning

Manages conversation history by summarizing long conversations and enforcing retention policies.

Features

Automatic Summarization: Summarize conversations when they exceed size limits
Message Pruning: Keep recent messages, summarize older ones
Retention Policies: Automatic deletion of old conversations
Privacy Controls: User can delete specific sessions

Usage

Summarization

from conversation.summarization.summarizer import get_summarizer

summarizer = get_summarizer()

# Check if summarization needed
messages = session.get_messages()
if summarizer.should_summarize(len(messages), total_tokens=5000):
    summary = summarizer.summarize(messages, agent_type="family")
    
    # Prune messages, keeping recent ones
    pruned = summarizer.prune_messages(
        messages,
        keep_recent=10,
        summary=summary
    )
    
    # Update session with pruned messages
    session.update_messages(pruned)

Retention

from conversation.summarization.retention import get_retention_manager

retention = get_retention_manager()

# List old sessions
old_sessions = retention.list_old_sessions()

# Delete specific session
retention.delete_session("session-123")

# Clean up old sessions (if auto_delete enabled)
deleted_count = retention.cleanup_old_sessions()

# Enforce maximum session limit
deleted_count = retention.enforce_max_sessions()

Configuration

Summarization Thresholds

Max Messages: 20 messages (default)
Max Tokens: 4000 tokens (default)
Keep Recent: 10 messages when pruning

Retention Policy

Max Age: 90 days (default)
Max Sessions: 1000 sessions (default)
Auto Delete: False (default) - manual cleanup required

Integration

With Session Manager

The session manager should check for summarization when:

Adding new messages
Retrieving session for use
Before saving session

With LLM

Summarization uses LLM to create concise summaries that preserve:

Important facts and information
Decisions made or actions taken
User preferences or requests
Tasks or reminders created
Key context for future conversations

Privacy

Users can delete specific sessions
Automatic cleanup respects retention policy
Summaries preserve context but reduce verbosity
No external storage - all local

Future Enhancements

LLM integration for better summaries
Semantic search over conversation history
Export conversations before deletion
Configurable retention per session type
Conversation analytics