Ein gutes Stimmenmanipulationsprogramm

  • Hallo zusammen.


    Ich suche derzeit ein gutes Programm, um Stimmen zu manipulieren, so das es auch einigermaßen gut klingt.


    Ich wollte es eigentlich so machen das meine NPCs sich auch ein wenig unterhalten. Ich dachte da so ähnlich wie in Skyrim oder so. Kurze sätze wie "Ja klar", "hast du schon gehört" oder was auch immer. Eben halt ein wenig etwas was zur Atmosphäre beiträgt.


    Dummerweise kann ich von Glück sagen wenn meine Stimme im Schnitt eine 1/4 Oktave oder so hinbekommt. Und ich würde diese Stimmen halt schon gerne in Mann, Frau, Kleinkind Junge/Mädchen, Alter Mann/Frau usw. vorliegen haben.


    Ich habe schon ein paar Tools gefunden, Voxel Sound ist eins davon, aber der verändert meine Stimme mal so gar nicht. Einige haben keine Aufnahmefunktion bzw. können nur Liveaufnahmen verzerren. Aber etwas was die Audiodateien, gerne auch als Stapelverarbeitung, nimmt und daraus einen ganzen Stack von Sätzen in Frauenstimme macht, das finde ich einfach nicht. Einzeln geht natürlich auch. Hauptsache das Ergebnis ist erträglich.


    Gibt es da etwas was ich vielleicht übersehen habe oder so?


    Vielen Dank im Voraus

  • Oh je. An so etwas versuche ich mich schon lange. Wenn du es einigermaßen gescheit haben willst, brauchst du Sprecher. Und selbst da ist es verdammt schwierig Leute zu finden, die sich in die Situation einfinden. Einfach einen Text runterleiern bringt nix.

    Das ist auch genau der Grund warum ich den Beitrag zum voice cloning rein gestellt hatte. (Und auch das steckt noch in den Kinderschuhen) Du kannst zwar versuchen mit einem anderen Akzent etwas höher und sehr langsam zu sprechen und das ganze dann wieder langsamer und tiefer zu machen, aber mehr als ein oder zwei andere Stimmen bekommst du auch damit nicht hin. Es sei denn man ist ein begnadeter Stimmenimitator.

    Also den nächsten Kumpel bitten. Und am besten vorher noch ein paar Bier, damit es nicht zu steif klingt. :) Ansonsten läuft alles auf die üblichen Stimmenverzerrer hinaus. Und die klingen nun einmal billig.

    Ansonsten werde ich das hier genau im Auge behalten falls es doch noch den ultimativen Geheimtipp gibt.

  • Wie sehrwitzig schon sagte - eigentlich brauchst du Sprecher. Zumindest wenn es profesionell sein soll. Zum dumm rumspielen und als test reicht es wenn du deine eigene Stimme verstellst und mal ganz langsam und dunkel sprichst - dann macht du das ganze mit nem Tool wie Goldwave 20% schneller. Klar für Produktion brauchst du auf lange Zeit echte Sprecher damit es gut klingt. Von sowas wie morphvox halte ich nix, klingt meist nach Mickey Mouse.

  • Sagen wir mal nicht gelungen.....

    ist genau die richtige Definition.

    Das ganze Zeug ist für die Tonne. Kann man mit so ziemlich jeden Audioprogramm alles selber zusammenschustern.

    Es hat sich wahnsinnig viel getan im Audiobereich. Es gibt Orchester mit allen Instrumenten und auch die Stimme lässt sich »geradebiegen« und mit den üblichen Verdächtigen aufhübschen. Aber den Klang einer anderen Stimme hinzubekommen.........null.

    Da kommt man sich vor, als würde man vor Windows95 sitzen.

  • Jo ganz genau - also timme 20% schneller hellt es etwas auf, aber wie die heisse Blondine von Gegenüber wird kein 58-Jähriger Fernfahrer aus Delmenhorst klingen, ganz egal mit welchem Tool. Zumindest nicht mit den heutigen tools. Oder es gibt die 10.000 Euro app die ich noch nicht probiert habe.

  • Na ich weiß nicht. So viel Aufwand mit extra Sprechern engagieren ist mein Projekt nun auch nicht wert. In 5-10 Jahren will ich das zwar auch mal an den Mann bringen, aber ich kann es mir ja nicht mal leisten einen der Grafiker hier zu bezahlen, um mir mal mein Logo richtig schick zu erstellen, geschweige denn vielleicht noch 6-8 Sprecher oder so. Also ich müsste die ja wenigstens hier füttern und regelmäßig tränken, wenn ich die hier zu Hause schon beschäftige.


    Das mache ich dann wohl mal wenn mein Dachboden fertig ist. Der hat fast 400 qm, wenn der ordentlich ist, lade ich hier alle mal ein, dann kann jeder pro Grillwürstchen einen Satz ins Mikrofon ablassen und auf dem Dachboden gibt es dann Essen beim großen Gemeinschaftszocken oder so.

  • Oh je. An so etwas versuche ich mich schon lange. Wenn du es einigermaßen gescheit haben willst, brauchst du Sprecher. Und selbst da ist es verdammt schwierig Leute zu finden, die sich in die Situation einfinden. Einfach einen Text runterleiern bringt nix.

    Das ist auch genau der Grund warum ich den Beitrag zum voice cloning rein gestellt hatte. (Und auch das steckt noch in den Kinderschuhen) Du kannst zwar versuchen mit einem anderen Akzent etwas höher und sehr langsam zu sprechen und das ganze dann wieder langsamer und tiefer zu machen, aber mehr als ein oder zwei andere Stimmen bekommst du auch damit nicht hin. Es sei denn man ist ein begnadeter Stimmenimitator.

    Also den nächsten Kumpel bitten. Und am besten vorher noch ein paar Bier, damit es nicht zu steif klingt. :) Ansonsten läuft alles auf die üblichen Stimmenverzerrer hinaus. Und die klingen nun einmal billig.

    Ansonsten werde ich das hier genau im Auge behalten falls es doch noch den ultimativen Geheimtipp gibt.

    Ich habe jetzt noch etwas weiter probiert. Das Hauptproblem bei den meisten Programmen ist, das man einen Satz nicht im Loop spielen kann und dann direkt per Schieber oder so ausprobieren oder angleichen kann. Ich glaube bei einigen könnte man schon ein wenig mehr rausholen, wenn man das Ganze quasi live regulieren könnte.


    Besonders lustig war ja noch Screamingbee. Da will die Software doch tatsächlich extra meine Stimme lernen und danach klingt es noch eine ganze Dosis extra schräg.


    Auch dein Voicecloning habe ich mal ausprobieren wollen. Weil im Video sieht es ja gar nicht so schlecht aus. Ich hab normalerweise auch Python auf dem Rechner, da ich auch ein wenig mit KI experimentiert habe. Aber irgendwie kann er nicht alle Zusätze installieren die benötigt werden. Schade. Aber von Python halte ich eh nicht so viel. Ich weiß gar nicht warum das alle so toll finden. Aber ich finde, es ist ein Rückschritt noch vor Basicinterpretern. Die Umsetzung von Python liegt mir so gar nicht, weswegen ich da jetzt auch nicht großartig auf Fehlersuche oder Problemlösungen gegangen bin.