arxiv

3 Articles

3

Microsoft Intern’s New AVED Framework Solves One of AI Audio-Video Editing’s Biggest Challenges: Sync

2025, March 27

3 Min Read

103

Microsoft interns developed AVED, a framework enabling synchronized audio and video editing via text prompts without retraining models.

Diffusion Models Generative AI

Researcher Builds Real-Time Emotion Classifier Using Spectrograms and Neural Networks

2025, March 26

3 Min Read

92

A new speech emotion recognition system uses deep learning to interpret emotions in speech through audio analysis, enabling broader accessibility.

Accessibility Audio AI

New Baidu AI Turns Voice Recordings into Realistic Talking Videos

2025, March 26

1 Min Read

71

A team of Chinese researchers developed AudCast, an AI system creating realistic talking videos from voice recordings with lifelike motions.

Audio AI Digital Humans

Page 1 of 1