Попробовала тут потестировать курсором.
Итог предсказуем:
- Курсор отлично гоняет четко прописанный смоук, находит малейшие недочеты тз и мне в принципе нравится.
- На сложных сценариях буксует, говорит, что не понимает как это тестировать и зачем.
- С точки зрения ux человеческий глаз вообще не заменим, агент не может понять, что такое удобство пользования.
- Итого вердикт: если есть хорошая модель - то регресс гонять можно, сложную логику уже сложнее.


Дискуссия