Skip Navigation

Technology @beehaw.org ono @lemmy.ca 10 mo. ago

Large Language Models can Strategically Deceive their Users when Put Under Pressure [simulation led to insider trading]

arxiv.org /abs/2311.07590

Technology @lemmygrad.ml ☆ Yσɠƚԋσʂ ☆ @lemmygrad.ml 10 mo. ago

Technical Report: Large Language Models can Strategically Deceive their Users when Put Under Pressure

arxiv.org /abs/2311.07590

Hacker News @derp.foo haxor @derp.foo

10 mo. ago

Misalignment and Deception by an autonomous stock trading LLM agent

arxiv.org /abs/2311.07590

1 comments

It's trained on human responses. Humans lie in their responses.