XaiJu
Hoeeeng
Hoeeeng

patreon


작업 근황입니다...!(Here’s a work update...!)

※The announcement is written in English, Chinese, and Japanese, so feel free to scroll down to find your preferred language!

※公告依次以英语、中文和日语撰写,向下滑动即可查看您需要的语言版本!

※お知らせは英語・中国語・日本語の順に掲載していますので、スクロールしてご希望の言語をご覧ください!

안녕하세요!

오랜만에 근황 소식 전해드립니다...!

결과적으로, 건강이 회복되어 다시 작업에 착수하고 있습니다!

아침에 매일 30분 산책하고 유산소 2시간씩 조져주니 수면패턴도 거의 돌아왔습니다.

역시 잘 자고 잘 먹고 잘 싸는 게 최고인 거 같군요.

그리고 쉬는 동안 왜 이렇게 작업에 무리를 하게 되었나, 스스로를 돌아봤습니다.

우선 첫번째는 제가 욕심이 많은 사람이기 때문에 그렇습니다.

모든 독자님의 요구에 부응하는 만족스러운 작품을 만들고 싶다...! 란 집념이 저를 무리하게 만들었고,

한동안 번아웃이 와서 잠시 휴식을 취해야 했습니다.

다만, 타고난 제 기질 자체가 올라오는 욕망은 반드시 채워야 하는 쪽이라, 휴식을 취하는 동안에도 저를 억누르기 쉽지 않았습니다.

계획했던 목표를 달성하지 못하면 뭔가 찝찝한 불쾌감이 제 안에 계속 남는 느낌이라 할까요?

특히 이런 불쾌감은 잠들 때가 되면 더욱 크게 올라와서, 잠에 들기가 너무 힘들었었습니다.

뭐, 결과적으로는 어느 정도 해결되었지만요!

그렇다면 어떻게 해결을 했나? 그것은 신경을 아예 다른 곳으로 돌리는 것이었습니다.

다른 작가들은 어떻게 스토리를 쓰는지 궁금해서 영화도 찾아보고, 애니도 찾아 봤는데, 진격의 거인이란 이 작품... 정말 대단하더군요.

이렇게 가슴이 웅장해지는 애니는 처음이었습니다.

그 외에도 최애의 아이라는 애니를 통해 요아소비란 그룹을 알게 되었는데, 좋은 노래가 상당히 많더군요.

저는 주로 밴드음악, 그러니까 coldplay, radiohead, muse, kean, mcr, 아니면 한국 아이돌 노래를 많이 들었었는데, 이 요아소비란 그룹... 귀가 트이는 느낌이었습니다.

특히 여자 보컬의 음색이 정말 매력적이더군요. 심지어 귀엽기까지 합니다.

아무튼, 꾸준히 운동하고 다른 작품 보며 제 작품에 신경을 꺼버리니, 불면증이 거의 해결되었습니다.

그리고 이제는 충분히 작업을 해도 괜찮겠다는 생각이 들어 다시 스토리를 쓰고 이미지를 뽑고 있습니다.

(7-2 편의 첫번째 페이지)

그리고 휴식을 취한 김에 제 작업 방식을 정비했습니다.

왜냐하면 제 작업 방식은 너무도 비효율적이라, 이미지 한 장 뽑는데도 시간이 많이 들 수밖에 없거든요!

그렇다면 비효율을 싫어하는 제가 왜 이런 작업 방식을 택할 수밖에 없었나...!

그것은 바로 '그림체' 때문입니다.

즉, 제가 뽑는 원래의 그림체는 아래와 같은 느낌인데,


이는 전부 nai(novel ai) version 3버전으로 뽑은 겁니다.

즉, 현재 nai4.5 full 까지 출시된 걸 감안하면 상당히 옛 버전이라 할 수 있죠!

그렇기에 v3 버전으로 이미지를 뽑는 건 상당히 불편할 수밖에 없습니다.

이렇게 하나의 인물이 나오는 이미지는 잘 뽑는 반면, 여러 인물을 뽑으면 이미지 퀄리티가 들쭉날쭉이거든요!


자, 독자님의 이해를 돕기 위해 아래와 같은 이미지를 뽑는다고 쳐봅시다.

'벨라와 주인님이 키스를 하고 있음'

저는 이를 위해, on back, on bed, black choker, kissing, blush, black lips, large breasts, hug, arms around neck, muscular male 등등의 프롬프트를 넣는다고 가정해봅시다.

결과가 어떤지 볼까요?

예, 참사가 일어났습니다.

주인님이 검은 립스틱에 초커를 하고 있고, 얼굴을 붉히고 있군요.

그리고 벨라의 체형이 왠지 늠름한 거 같지 않습니까?

벌크업한 벨라가 주인님을 끌어안고 키스를 주도하고 있군요. 제 의도를 완전히 벗어났습니다.

주인님에게 적용되어야 할 'muscular male'이 벨라에게 간 느낌입니다.

그리고 주인님 등에 붙은 사진은 뭔데....? 저게 왜 붙었는지는 저도 모르겠습니다.

아무튼 v3는 두 명 이상의 인물이 등장하면 결과가 썩 좋지 않습니다.

때문에 v3에선 제대로 된 이미지를 건지기 위해 여러 후보정 작업을 해야 합니다.

보다시피 초기 이미지는 이미지 열화도 상당하기에(특히 얼굴), 특정 부분을 잘라서 확대한 다음 다시 뽑아야겠군요.

(여기 빨간색 네모박스를 잘라내서 개별 이미지로 보정한 다음 붙여 넣겠습니다. 그 외에도 벨라의 체형과 어정쩡한 주인님의 동작도 손봐야겠군요.)

(흠... 이제 좀 봐줄 만 합니다. 다만 손의 형태가 불분명하고, 머리카락 역시 조금 이상하죠? 이는 제가 새로로운 이미지를 붙여넣고 테두리를 지우면서 그 밑의 이미지가 겹쳐서 그렇습니다. 저 부분 또한 후보정 작업을 해서 자연스럽게 바꿔야 합니다.)

다만, 2번째 이미지도 제 기준에선 b컷입니다.

벨라의 눈 형태가 불분명하고, 벨라의 체형도 좀 더 여리게 보정될 필요가 있어 보입니다. 어깨가 주인님보다 넓은 것 같은...

그리고 자세히 보면 주인님의 목도 조금 이상합니다.

이 역시 위에 덧붙인 이미지를 지우면서 그 밑의 이미지와 겹쳐 보여서 그런 겁니다.

아무튼 v3에선 제대로 된 이미지를 건지기 위해 수많은 가챠를 해야 하고, 보정에도 상당한 공이 듭니다.

반면 최신 버전인 v4.5 full은 어떨까요?

완벽합니다.

구도와 자세 자체는 흠잡을 곳이 없습니다.

뭐, 몸이 좀 더 밀착되고 벨라의 눈동자가 살짝 풀려있는 상태면 더 좋겠지만, 그쯤은 inpaint 기능으로 쉽게 구현이 가능합니다.

한마디로, v4.5f을 쓰면 원하는 구도를 뽑기 훨씬 쉬워진다는 장점이 있죠.

반면, 그림체가 v3에 비해 많이 바뀌었습니다.

이는 제가 v3 그림체를 복원하려 온갖 시도를 해봤지만, 결국 실패하여 정착한 그림체가 저 그림체여서 그렇습니다 ㅠㅠ

때문에 저는 4.5f로 뽑은 이미지를 다시 v3 그림체로 변환한 다음, 그 과정에서 열화된 이미지를 보정하여 합치는 방식으로 이미지를 뽑고 있습니다.

그 결과물은 아래와 같습니다.

어떻습니까? 이제는 제법 예전 그림체 느낌이 나죠?

다만, 이렇게 만족스러운 이미지를 뽑는데는 시간이 걸릴 수밖에 없었고, 이런 작업 방식이 제 체력을 갉아먹고 있었습니다.

그래서 쉬는 동안 제 작업 방식을 체계화시킬 필요가 있다 판단했고, 'nai 태그 생성기'라는 gptz를 만들었습니다.

바로 이 녀석입니다.

내부 구조는 대략 이렇습니다.

사용자가 자연어로 원하는 이미지를 입력하면, 이 녀석이 알아서 최적화된 프롬프트로 출력해줍니다.

바로 아래 이미지처럼요!

그리고 4.5f버전을 v3 버전으로 바꾸는 것도 가능합니다.

이렇게 nai프롬프트 생성기를 만들고 나니 작업이 훨씬 수월해졌습니다.

일일히 제가 직접 바꿔야 했던 게 거의 없어졌으니까요.

물론, 그렇다고 제 마음에 100% 만족할 정도는 아닙니다.

아직 이 녀석은 초기 버전이고, 마음에 안 드는 부분도 상당히 많습니다.

특히, 5000여개의 단부루 태그 데이터셋을 기껏 확보해 놨는데, 그걸 제대로 참조하질 못하더라구요.

아직 손 봐야 할 것들이 많습니다.

....뭐, 어찌 됐든!

제 근황은 여기까지였습니다.

다시 건강을 회복한 만큼 열심히 달려보겠습니다.

그리고 다음 화는 대략 314컷으로 구성될 예정이며, 한 페이지당 최소 4컷~ 5컷이 들어간다는 점을 감안하면, 79페이지 분량의 작품이 나올 것으로 예상됩니다.

예상 업로드 일은 넉넉히 잡아 7월 20일입니다.

어느 정도 윤곽이 잡히면 다시 업로드 일을 알려드리겠습니다.

감사합니다.

Hello everyone!

It’s been a while—here’s a quick update on how I’ve been doing!

Long story short, I’ve recovered my health and resumed work!

Thanks to a daily 30-minute walk and two hours of cardio every morning, my sleep pattern is almost back to normal.

As expected, good sleep, good food, and good bowel movements are key.

During my break, I also took time to reflect on why I had pushed myself so hard with work.

The first reason? I’m just an ambitious person.

I wanted to create a story that satisfied every reader…! That kind of determination ended up pushing me into burnout.

So I had to take a short break.

But even during that break, I found it hard to suppress my urges—I’m the kind of person who can’t stand not achieving a goal.

That sense of discomfort, especially at night, made it hard to sleep.

Eventually, I found a way to cope!

And how did I do that? I turned my attention elsewhere.

I got curious about how other creators write their stories, so I watched movies and anime. One of them—Attack on Titan—was truly incredible.

I’ve never felt my chest swell with emotion like that before.

Thanks to another anime, Oshi no Ko, I discovered the group YOASOBI—so many amazing songs.

I usually listen to bands like Coldplay, Radiohead, Muse, Keane, MCR, or Korean idol music. But YOASOBI really opened my ears.

The female vocalist’s tone is especially attractive—and honestly, pretty cute too.

Anyway, after keeping up with exercise and tuning out from my own work by enjoying others’, my insomnia has almost disappeared.

And now I finally feel ready to start creating again—writing stories and generating images.

(This is the first page of Part 7-2)

While taking a break, I also decided to reorganize my workflow.

Because the way I had been working was horribly inefficient—it took forever to generate a single image!

So why did someone like me, who hates inefficiency, stick with that method?

The answer: the art style.

The images I want look like this:

All of these were generated using NAI (NovelAI) Version 3.

Considering we’re now on v4.5 full, that’s quite outdated.

Generating images in v3 is just… not convenient.

It works fine for solo characters, but the quality drops drastically when multiple characters appear.

To illustrate, let’s say I want to generate this scene:

"Bella and Master kissing."

I’d put in prompts like: on back, on bed, black choker, kissing, blush, black lips, large breasts, hug, arms around neck, muscular male…

Now, let’s see how that turns out.

Yeah, disaster.

Master ends up wearing black lipstick and a choker, blushing like crazy.

And Bella looks oddly buff, doesn’t she?

Looks like muscular Bella is dominating Master in the kiss. Not what I intended at all.

The “muscular male” tag clearly went to Bella.

And what’s that photo on Master’s back…? I have no idea.

Bottom line: v3 doesn’t work well with multi-character scenes.

To get a usable image, I need tons of post-editing.

The original image tends to degrade (especially the face), so I have to crop and regenerate parts separately.

(I’ll crop the red box, enhance it as a separate image, and then paste it in. Also, I’ll need to fix Bella’s build and Master’s awkward posture.)

(Okay… this one is a bit better. But the hands look strange and the hair's off. That’s because I pasted a new image and erased the border, which overlapped with the old one. I’ll fix that too.)

Still, even this second image is a B-grade cut for me.

Bella’s eyes are vague, and her build needs to be more delicate. Her shoulders look wider than Master’s…

Also, Master’s neck looks off on closer inspection.

That’s due to image overlap when I erased the pasted part above.

Anyway, getting a usable v3 image requires massive gacha attempts and tons of manual fixing.

But how about the latest version, v4.5 full?

Perfect.

The poses and composition are spot-on.

Sure, it’d be nicer if their bodies were more entwined and Bella’s eyes slightly unfocused, but that’s easy to fix with inpainting.

In short, v4.5f makes it way easier to generate the scene I want.

However… the art style is quite different from v3.

I tried everything I could to restore the v3 style, but nothing worked—so I settled for this one 😭

That’s why I now generate in 4.5f, then convert the image to the v3 style, retouching and merging as needed.

Here’s the result:

Looks close to the old style now, right?

But yeah—it takes time and drains energy to reach this level of quality.

So during my break, I knew I had to systemize my workflow. That’s when I created "gptz," the NAI tag generator.

Here it is.

Here’s how it works:

You input natural language describing the image you want, and it automatically generates an optimized prompt.

Like this:

It even supports converting v4.5f prompts into v3-compatible format.

Thanks to this prompt generator, my workflow is much smoother now.

I barely need to do any manual rewriting.

That said, I’m not 100% satisfied with it.

This is still an early version, and there are many rough spots.

Especially—despite having over 5,000 Danbooru tags prepared, it’s still not referencing them properly.

So there’s lots of room for improvement.

Anyway, that’s it for my update!

Now that I’m back in good health, I’ll be giving it my all.

The next episode will have around 314 cuts, and since each page has 4–5 cuts, it should be about 79 pages in total.

I’m aiming for a generous upload date of July 20.

Once things are more finalized, I’ll update you again.

Thanks so much!

大家好!

好久不见,来和大家分享一下近况!

总的来说,我的身体恢复了,现在已经重新开始工作啦!

每天早上散步30分钟,再加上两个小时的有氧运动,我的作息也基本恢复正常了。

果然还是——好好吃饭、好好睡觉、好好排便,才是最重要的。

在休息期间,我也反思了一下自己为什么会把工作逼到这么极限。

首先一个原因是——我这个人本来就特别贪心(笑)

“想创作出能让所有读者都满意的作品!”这样的执念让我透支了自己,导致最终出现了倦怠感。

所以我必须暂时停下来休息一下。

不过……我天生就是个一旦有了欲望就必须满足的人,所以即使在休息中,也很难真正压抑住自己。

如果没有完成既定目标,内心就会一直有种说不出的不爽感。

特别是晚上睡觉时,这种不适感会更加放大,导致我一直难以入睡。

当然——后来终于找到了解决办法!

那就是:彻底把注意力转移到别的事情上。

我开始对别的创作者是如何写故事感到好奇,于是找来了不少电影和动画来看。

其中《进击的巨人》……真的震撼到我了。

从没看过一部作品能让我心潮澎湃成那样。

另外通过《我推的孩子》这部动画,我还认识了YOASOBI这个音乐组合——歌都超棒!

我以前主要听的是Coldplay、Radiohead、Muse、Keane、MCR这种英摇,还有一些韩流爱豆的歌。

但YOASOBI给我的感觉就像是“耳朵开窍”了一样。

尤其是女主唱的音色真的非常迷人,甚至可以说是很可爱!

总之,在我坚持运动的同时,把注意力从自己创作中移开,去欣赏别人的作品之后,失眠的问题几乎就消失了。

而现在,我终于觉得可以安心重新投入创作了——开始写故事,生成图像。

(这是7-2篇的第一页)

趁着休息的机会,我还重新整理了一下我的工作流程。

因为我之前的作业方式实在是太低效了——就算只是生成一张图也要花非常久!

那么,像我这样讨厌低效率的人,为什么偏偏采用了这种方式呢?

那是因为——画风的问题

我想要的画风,大概是像这样的感觉:

这些图都是通过 NAI(NovelAI)Version 3 生成的。

考虑到现在都已经出到 4.5 full 版了,可以说是非常旧的版本了。

所以用 v3 生成图像确实非常不方便。

比如单人图还可以勉强接受,但一旦涉及到多角色,图像质量就变得很不稳定。

为了便于说明,我们假设我要生成这样一个场景:

“贝拉和主人在接吻。”

我会输入这样的提示词:on back, on bed, black choker, kissing, blush, black lips, large breasts, hug, arms around neck, muscular male 等等。

看看结果会怎样吧?

嗯……灾难现场。

主人的嘴涂着黑口红,还戴着项圈,脸也羞红了。

而贝拉的体型怎么看都壮实得过头了……

看起来就像是肌肉猛女贝拉在主动抱住主人亲吻,完全不是我想要的画面!

“muscular male” 这个标签明明是给主人的,结果却跑到了贝拉身上。

而且主人背后还贴着一张莫名其妙的照片……我也不知道那是哪里来的。

总之,v3 在生成多角色场景时,表现很差。

为了得到一张能用的图,需要做大量后期处理。

像这种初始图,经常存在画面退化问题(尤其是脸部),所以我必须把部分区域裁剪出来放大后再重新生成。

(我会把红框部分裁剪出来、进行单独修图,然后再贴回去。除此之外贝拉的体型和主人的姿势也需要修一下。)

(嗯……这样就好多了。不过手的形状不太自然,头发也有点奇怪。那是因为我粘贴了新的图像并擦除了边框,结果和下方图像重叠了。那部分也还需要修复。)

不过,说实话第二张图我也只能当作B级备选。

贝拉的眼型不清晰,体型也还不够纤细。她的肩膀甚至看起来比主人还宽……

仔细看主人的脖子也有点怪。

这是因为贴图时上层图像和底图有些重叠了。

总之,在 v3 中想出一张像样的图像,简直是无尽的“抽卡”+繁琐的修图。

那么反观最新的 v4.5 full 版本呢?

完美。

构图和姿势几乎无可挑剔。

虽然如果身体再贴近一点、贝拉的眼神再涣散一些会更好,但这些用 inpaint 功能就能轻松解决。

一句话总结——v4.5f 更容易生成我想要的场景

不过画风也确实和 v3 差了不少。

我也尝试过各种方法想还原 v3 的画风,最终还是失败了,只好选择定居在目前的风格里 😭

所以我现在的方式是:用 4.5f 生成图像,再转换成 v3 风格,然后进行修复合成。

最终效果是这样的:

怎么样?是不是已经很接近我以前的风格了?

当然,能产出这种让我满意的图,确实也挺耗时间和体力的

所以,我在休息期间就觉得——必须要系统化我的工作流才行。

于是,我就开发了这个叫做 “nai标签生成器(gptz)” 的工具。

就是它。

它的大致结构是这样的:

用户只需输入想要画面的自然语言,它就会自动生成最优化的提示词。

像下面这样:

它也支持将 v4.5f 的提示词转换为 v3 兼容格式。

自从有了这个nai提示生成器,我的工作流程轻松了不少。

之前需要我手动改写的部分,现在几乎都自动处理了。

当然,说完全满意是不可能的。

毕竟这还只是初期版本,还有很多不成熟的地方。

特别是,我辛辛苦苦整理了5000多个Danbooru标签数据集,它却还不能很好地调用这些数据。

所以后续还是有很多地方要继续优化。

……总之!

这就是我近期的近况啦!

恢复健康之后,我也会继续努力!

接下来的一话大概会有314张分镜图,每页预计会包含4~5张,因此全话预计会有79页左右的篇幅。

预计的上传日期是7月20日,宽松一点计算。

等我更明确地定稿之后,会再给大家具体通知上传时间!

感谢大家的支持!

こんにちは!

お久しぶりです、近況をご報告します…!

結論から言うと、体調が回復して、再び創作作業に取り掛かっています!

毎朝30分の散歩と2時間の有酸素運動をこなしていたら、睡眠リズムもほぼ戻ってきました。

やっぱり、「よく食べて、よく寝て、よく出す」ことが何より大事ですね。

そして、この休養期間中に、どうしてあんなに無理してしまったのか、自分自身を振り返ってみました。

まず第一に、僕がとても欲張りな性格だからです。

「すべての読者さんを満足させる作品を作りたい!」という執念が、自分を追い込みすぎてしまったんです。

その結果、一時的に燃え尽きてしまい、休養を取ることになりました。

とはいえ、僕の性格的に、一度湧き上がった欲求はどうしても満たしたくなるタイプでして……休んでいても、自分を抑えるのが本当に難しかったです。

決めた目標を達成できないと、心の奥にずっとモヤモヤした不快感が残るんですよね。

特にそのモヤモヤは、夜寝る前になると一気に押し寄せてきて、なかなか眠れなかったりしました。

まあ、結果的にはなんとか解決できましたが!

じゃあどうやって解決したかというと、「完全に意識を別の方向に向けること」でした。

他の作家さんがどうやって物語を作っているのか気になって、映画を観たり、アニメを観たりしていました。

その中でも『進撃の巨人』という作品……本当に衝撃的でした。

あんなに胸が熱くなるアニメは初めてでした。

それ以外にも、『【推しの子】』というアニメを通してYOASOBIというグループを知ったのですが、素晴らしい曲がたくさんあるんですよ。

普段はColdplay、Radiohead、Muse、Keane、MCRとか、あるいはK-POPアイドルの音楽をよく聴いてたんですけど、YOASOBIは…まさに「耳が開く」ような衝撃でした。

特に女性ボーカルの声が本当に魅力的で、しかもめちゃくちゃ可愛いんですよね。

そんな感じで、運動を継続しつつ、創作から意識を外して他の作品を楽しんでいたら、不眠症がほぼ改善されました。

そして今、「もう大丈夫、創作を再開してもいい」と思えるようになり、ストーリー作りや画像生成を再開しています。

(7-2話の最初のページです)

それと、せっかくの休養中に、自分の作業スタイルを見直すことにしました。

というのも、僕のこれまでの作業方法はあまりにも非効率で、たった1枚の画像を作るのにもかなりの時間がかかっていたんです!

じゃあ、効率の悪いことが嫌いな僕が、なぜそんな方法を選んでいたのか…?

それは「絵柄」のせいです。

僕が理想としている絵柄は、たとえばこんな感じのものです:

これらはすべて、NAI(NovelAI)のバージョン3で生成したものです。

今はもうv4.5 fullまでリリースされているので、かなり古いバージョンですね。

そのため、v3で画像を生成するのはどうしても面倒になってしまいます。

1人キャラの画像ならまだなんとかなりますが、複数キャラになるとクオリティが不安定でバラつきが出てしまいます。

読者の皆さんに分かりやすく説明するために、以下のようなシーンを作ろうとしていると仮定してみましょう。

「ベラとご主人様がキスをしているシーン」

このために、on back, on bed, black choker, kissing, blush, black lips, large breasts, hug, arms around neck, muscular male などのプロンプトを入力したとします。

その結果はというと――

……はい、事件発生です。

ご主人様が黒リップにチョーカー、しかも顔を赤らめてます。

そして、ベラの体格がやけにたくましく見えませんか?

筋肉ムキムキのベラがご主人様を抱きしめて、積極的にキスしてるような構図に…完全に僕の意図と逆ですね。

“muscular male”というタグが、なぜかベラに適用されちゃった感じです。

それにしても、ご主人様の背中に貼られた謎の写真は何なんでしょう…僕にも分かりません(笑)

とにかく、v3では複数キャラが出ると大体こうなります。

なので、v3で満足のいく画像を得るには、かなりの後処理が必要です。

ご覧の通り、元画像は画質が劣化してしまうことが多く(特に顔)、一部を切り取って拡大し、再生成する必要があります。

(赤枠の部分を切り抜いて別画像として補正し、貼り付けます。ベラの体型や、ご主人様の中途半端な動作も修正が必要ですね)

(うん…まあ見れるようにはなってきました。ただ手の形が不自然だし、髪の毛も少しおかしいですね。これは新しい画像を貼って、枠を消した結果、下の画像と重なったせいです。その部分も修正が必要です)

とはいえ、この2枚目の画像も僕の中ではBカット扱いです。

ベラの目の形がぼんやりしてるし、体格ももっと華奢に補正すべきですね。肩幅がご主人様より広く見えるような…。

よく見るとご主人様の首も少し変です。

これも上に貼った画像を消したとき、下の画像と重なって見えてしまったからです。

とにかく、v3で満足できる画像を得るには、何度もガチャを回して、手作業で補正するしかありません。

では、最新のv4.5 fullはどうかというと――

完璧です。

構図やポーズも非の打ち所がない仕上がり。

まあ、もう少し身体が密着してたり、ベラの瞳が少しトロンとしていたら最高なんですが、それくらいはinpaint機能で簡単に調整できます。

つまり、v4.5fを使えば、理想の構図を出すのが格段に楽になるということです。

ただし、そのぶん絵柄がv3と大きく異なります。

僕はどうにかしてv3の絵柄を復元しようと試しましたが、すべて失敗して、結局今のスタイルに落ち着いた感じです😭

なので、今は4.5fで生成した画像を、v3の絵柄に変換し、劣化した部分を補正・合成するという手法で作業しています。

その結果がこちら:

どうでしょう? だいぶ以前の絵柄に近づいてきた気がしませんか?

でも、こうやって満足のいく画像を作るにはどうしても時間がかかるし、体力も消耗するんです。

だからこそ、この休みの間に「作業の仕組みを整えよう」と思い立ち、"naiタグ生成器(gptz)"を開発しました。

こいつがそれです。

内部構造はざっくりこんな感じ。

ユーザーが欲しいイメージを自然言語で入力すると、それに最適化されたプロンプトが自動で出力されるというものです。

下の画像のように:

そして、4.5fで作ったプロンプトをv3用に変換することも可能です。

このnaiプロンプト生成器を作ったおかげで、作業効率が一気に上がりました。

以前のように毎回手作業で直す必要がほとんどなくなりました。

とはいえ、まだ100%満足してるわけではありません。

このツールはまだ初期バージョンで、気になるところも結構あります。

特に、せっかく5000件以上のDanbooruタグデータを揃えたのに、それをちゃんと参照してくれないんです。

まだまだ改善の余地はたくさんあります。

……と、いうわけで!

これが僕の近況報告でした!

健康も回復したことですし、また気合い入れて頑張ります!

次回作は約314カット構成になる予定で、1ページあたり4〜5カットを想定すると、全79ページくらいのボリュームになる見込みです。

公開予定日は、余裕を見て7月20日としています。

ある程度形が見えてきたら、また改めて公開日をお知らせします!

いつも応援ありがとうございます!

Comments

7月20日正篇上传之后,预计会更新短篇!

동우 이

很高兴看到你的状态恢复!加油啊,作者大大,我们会陪着你,也会陪伴着这个故事!

Zh Ga

那么这个月的短篇会有吗?

ATP


More Creators