多模态LLM视觉推理能力堪忧,浙大领衔用GPT-hash生态-hash极限跳伞